Hi,
проблему решил и по endings оно теперь работает нормально.
Solution:
1) в htfuzzy/EndingsDB.cc убираем нафиг строчки
system(form("/bin/mv %s %s;/bin/mv %s %s",
TMP_ROOT2WORD, config["endings_root2word_db"],
TMP_WORD2ROOT, config["endings_word2root_db"]));
После чего оно перестает стирать временную базу из /tmp
2) режем словарь на кусочки. Я где-то читал про 100 строк, но
на 100-строчных кусках уже видно замедление в конце. Я порезал на
куски по 40
split -l 40 russian.dict
3) напускаем на это htfuzzy:
for i in x* y* z*
do
mv $i /opt/www/htdig/common/russian.dict
htfuzzy -v -v | tail -5 # чтобы видеть прогресс
done
4) копируем /tmp/*gdbm в /opt/www/htdig/common/нужныйфайл.db
Это все - для htdig-3.1.0b1.
Да
5) там явно проблема в линейном поиске. Пишем автору ht/Dig
"так программы не пишут" :)
Alex
p.s Лебедевский словарь проиндексировался примерно за час на Celeron-300A/450
=============================================================================
= Apache-Talk@lists.lexa.ru mailing list =
Mail "unsubscribe apache-talk" to majordomo@lists.lexa.ru if you want to quit.
= Archive avaliable at http://www.lexa.ru/apache-talk =