Victor Wagner wrote:
>
> Ты пытаешься заменить мою задачу на другую.
Вовсе нет. Я просто предлагаю подумать (видимо на досуге) над другим ее
решением.
> Да, я верю, что есть задачи,
> которые средствами XML решаются лучше чем, чем бы то ни было другим. Но
> Моя задача заключается в том, чтобы дать пользователям Word возможность
> публиковать документы посредством некоей системы mod_perl-овых скриптов
> (Communiware называется) с наименьшими затратами труда для них, так,
> чтобы получался HTML, который считает корректным последний (1.020)
> weblint, а оформление задавалось не автором документа, а дизайнером
> виртуального сайта.
Ну я почти так эту задачку и понимал. Ты же не просто вордовские
документы складываешь, верно? Значит их надо во что-то трансформировать.
Если при этом оформление тебя не интересует, то XML - самое то. Именно
извлечь из документов только содержание _и структуру, если она есть_,
сделать из нее XML, оформление автора выбросить, и применить оформление,
заданное в стиле. Кроме всего прочего, Word-2000 кажется будет уметь
непосредственно XML, и тогда можно будет спокойно забыть про весь этот
бред с RTF и пр. В кои веки новая версия Ворда может быть даст
преимущества не только MS ;-)
> В принципе, на weblint свет клином не сошелся. Если мне предложат другой
> чекер html, который будет столь же прост в обращении, но будет позволять
> работать с html 4.0, причем не будет пропускать (лучше, если будет не
> ругаться а молча выкидывать) некоторые тэги (<SCRIPT>,<APPLET>,<OBJECT>)
> и некоторые атрибуты некоторых других, вполне допустимых тэгов
> (например, у FONT пропускать только SIZE и COLOR.
Это вполне способен сделать любой SGML-процессор, например nsgmls, если
дать ему в зубы нужный тебе DTD. Ведь на HTML 4.0 свет клином не
сошелся, бери родной DTD, выкинь оттуда лишние (с твоей точки зрения)
атрибуты и тэги, и натравливай это на HTML. Делов-то...
> Можно было бы еще и ID,
> но тогда надо заставить всех дизайнеров включить в их CSS некий заранее
> определенный набор этих самых ID, и сообщить его пользователям)
А при чем тут ID? Может все-таки class? Id - это для _отдельно взятого_
одного тэга, такое вообще нужно редко.
> А толку мне в этом XML - клиентам мне надо все равно отдавать HTML.
Угу. Это прекрасно делается при помощи того же xt, трансформацией
XML-html. Я же говорю - если ты хочешь получить быстродействие - то это
действительно надо делать другими средствами. А от XML ты попутно
получишь то, что HTML будет отдаваться не простой, а специально
заточенный под конкретный браузер, динамический иначе говоря. Хотя можно
и статически.
> > Ну, это отговорка. Аудит скорее потребуется для перла - потому что
> > XSL-процессор по определению не может делать ничего иного, кроме как
> > трансформировать XML-документы. В отличие от.
>
> Что не отменяет необходимости security audit.
А я и не говорю, что совсем не нужно. Просто это потенциально более
специализированная и более надежная вещь. Чтобы такую сломать, придется
сильно извратиться.
> Можешь мне назвать URL на XML-процессор, в котором нету потенциальных
> buffer overflow?
Легко. Из них добрая половина написаны на Яве, там если такое и бывает,
то совсем с другими последствиями ;-) А если серьезно - то конечно над
этим подумать надо.
=============================================================================
= Apache-Talk@lists.lexa.ru mailing list =
Mail "unsubscribe apache-talk" to majordomo@lists.lexa.ru if you want to quit.
= Archive avaliable at http://www.lexa.ru/apache-talk =