In <19991006222834.W3743@elf.ihep.su> Eugene B. Berdnikov (berd@desert.ihep.su)
wrote:
EB> On Wed, Oct 06, 1999 at 09:25:36PM +0400, Khimenko Victor wrote:
>> EB> А что, для этого надо править mod_charset? Вышлите Алексу таблицы для RA
>> EB> и кусочки конфигов, он бодро вставит их куда следует. :)
>> EB> И мы покорим страну Восходящего Солнца. >;)
>>
>> Для тех кто в танке: в японском более 256 символов (потому как там есть и
>> иероглифы :-)... Со всеми вытекающими... Сами догадайтесь какими...
EB> Смекалка помогает: таблицы будут wide, а любимый выходной чарсет - utf8.
А если подумать ? Как wide таблицы помогают обрабатывать текст, в котором могут
встречаться более 256 символов ? UTF8 сдержит все что нужно (не все иероглифы,
но все иероглифы входящие в обычно использующиеся шрифты :-), но если всех
заставлять пользоваться UTF8, то при чем тут вообще RA ???
EB> Если конечно, его хватает на все иероглифы, в чем я немного сомневаюсь.
На все -- не хватает, но этого и не нужно :-)
EB> Аборигены при желании смогут написать код, понимающий 2-байтовые
EB> кодировки в CharsetSourceEnc, и 65536-входные таблицы перекодировки.
К сожалению вы не знаете реалий жизни. Там используются не 2-байтовые
кодировки, а "многобайтовые" кодировки. Где разные буквы могут кодироваться
разным числом байт (ну примерно как в UTF8 :-)... Хотя разница невелика:
ни те ни другие RA не может воспринимать как входные :-/
EB> Нам оно пока не к спеху. :)) Зато Апач у них будет RA. :-)
EB> Может быть, даже профинансируют того, кто первый схватит эту задачу. :)
Ну это вряд ли...
=============================================================================
= Apache-Talk@lists.lexa.ru mailing list =
Mail "unsubscribe apache-talk" to majordomo@lists.lexa.ru if you want to quit.
= Archive avaliable at http://www.lexa.ru/apache-talk =