On Mon, 25 Oct 1999, Serge Shikov wrote:
> > не справляется. Из-за обилия в нем всяческих <xml>.
> А что, на <xml> натравить XML-процессор не пробовал?
А нафига? Мне же нужно содержание документа, а не то, что Word думает о
его внешнем виде.
s!<xml>.*?</xml>!!is на него натравить надо.
Содержанием с моей точки являются
1. текст
2. низкоуровневые шрифтовые выделения <b><u><i><em>
3. Списки
4. Разбиение по параграфам и заголовки <h[1-6]>. Последних в html из-под
Word почти не бывает, так как большинство пользователей ворда не
подозревают о существовании стилей.
5. Гиперссылки
6. Таблицы. Включая выравнивание внутри ячеек, но исключая bgcolor.
--------------------------------------------------
Victor Wagner vitus@ice.ru
Programmer Office:7-(095)-203-51-19
Institute for Commerce Home: 7-(095)-135-46-61
Engineering http://www.ice.ru/~vitus
=============================================================================
= Apache-Talk@lists.lexa.ru mailing list =
Mail "unsubscribe apache-talk" to majordomo@lists.lexa.ru if you want to quit.
= Archive avaliable at http://www.lexa.ru/apache-talk =