ПРОЕКТЫ 


  АРХИВ 


Apache-Talk @lexa.ru 

Inet-Admins @info.east.ru 

Filmscanners @halftone.co.uk 

Security-alerts @yandex-team.ru 

nginx-ru @sysoev.ru 

  СТАТЬИ 


  ПЕРСОНАЛЬНОЕ 


  ПРОГРАММЫ 



ПИШИТЕ
ПИСЬМА














     АРХИВ :: Apache-Talk
Apache-Talk mailing list archive (apache-talk@lists.lexa.ru)

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[apache-talk] ht/Dig again



Hi,

проблему решил и по endings оно теперь работает нормально.
Solution:

1) в htfuzzy/EndingsDB.cc убираем нафиг строчки
   system(form("/bin/mv %s %s;/bin/mv %s %s",
                TMP_ROOT2WORD, config["endings_root2word_db"],
                TMP_WORD2ROOT, config["endings_word2root_db"]));

После чего оно перестает стирать временную базу из /tmp

2) режем словарь на кусочки. Я где-то читал про 100 строк, но
на 100-строчных кусках уже видно замедление в конце. Я порезал на
куски по 40

split -l 40 russian.dict 

3) напускаем на это htfuzzy:
 for i in x* y* z*
 do
   mv $i /opt/www/htdig/common/russian.dict
   htfuzzy -v -v | tail -5 # чтобы видеть прогресс
 done

4) копируем /tmp/*gdbm в /opt/www/htdig/common/нужныйфайл.db

Это все - для  htdig-3.1.0b1.

Да
5) там явно проблема в линейном поиске. Пишем автору ht/Dig
"так программы не пишут" :)


Alex
p.s Лебедевский словарь проиндексировался примерно за час на Celeron-300A/450




  

=============================================================================
=               Apache-Talk@lists.lexa.ru mailing list                      =
Mail "unsubscribe apache-talk" to majordomo@lists.lexa.ru if you want to quit.
=       Archive avaliable at http://www.lexa.ru/apache-talk                 =



 




Copyright © Lexa Software, 1996-2009.