On Tue, 5 Feb 2002, Alex Tutubalin wrote:
>
> интересует мнение обчественности.
>
> Вот допустим есть поисковая система по сайту. Раз в deltaT она делает
> переиндексацию - старые документы сносит, новые - добавляет.
>
> Возникает вопрос - нужно ли делать обновление поискового индекса в
> транзакции - т.е. пока все изменения не произошли для собственно поисковика
> индекс остается старым, либо же делать отдельную транзакцию для каждого
> документа ?
А смысл? Зачем делать документ транзакцией - понятно.
Выкладывание файла плюс-минус атомарная операция, как и его удаление.
Поэтому если изменение поискового образа файла будет тоже атомарной
операцией, и поисковый образ будет всегда соответствовать какому-то
реальному состоянию документа (возможно, уже прошедшему) это хорошо.
А вот выкладывание пачки файлов - операция явно не атомарная.
Поэтому смысла атомизировать состояние ее поискового образа - нет.
Более того, если индексирование пачки документов будет транзакцией,
то количество "документо-секунд" несоответствия поискового образа
и файлов увеличится.
> Да, предвидя вопросы. Я использую http://openfts.sourceforge.net
> c Ispell-словарями (либо с другой морфологией - это не так важно). ht://Dig
> с lexa.ru скоро будет удален, равно как и Yandex.Site с apache.lexa.ru :)
А что - fts так крут? Я на него посмотрел, мне стало интересно,
но не настолько чтобы делать его альтернативным по отношению к многосерчу
движком.
--
Victor Wagner vitus@ice.ru
Chief Technical Officer Office:7-(095)-748-53-88
Communiware.Net Home: 7-(095)-135-46-61
http://www.communiware.nethttp://www.ice.ru/~vitus
=============================================================================
= Apache-Talk@lists.lexa.ru mailing list =
Mail "unsubscribe apache-talk" to majordomo@lists.lexa.ru if you want to quit.
= Archive avaliable at http://www.lexa.ru/apache-talk =