On Tue, 8 Jun 1999, Sergey Gershtein wrote:
> From: Sergey Gershtein <sg@mplik.ru>
> Subject: [apache-talk] Как получить список различных форм слова?
> X-Mailer: The Bat! (v1.33) UNREG / CD5BF9353B3B7091
>
> Доброе время суток, господа!
>
> Есть такая задача - для собственной искалки (поиск идет по базе данных)
> хочется на основе заданного слова получить список всяческих его форм.
> Например:
> слово -> слово слова слову словом слове слов словам словами словах
>
> Пошарив по архивам, понял что подобное умеет ht:/Dig с прикрученным
> словарем от ispell, etc., etc. В общем, почитал всяческие инструкции, в
> т.ч. от Alex-а, все собрал, поставил, работает. Но мне надо не это.
> Мне нужно нечто, что построило бы базу словоформ (как htfuzzy) и нечто,
> что по запросу выдало бы мне все формы заданного слова. И ничего больше.
Второе - это, собственно, словарь от ispell. Его нужно только научиться
обрабатывать. И в его texinfo это по-моему, даже описано.
Во всяком случае, из исходников словаря с очевидностью следует как
генерить список словоформ по основной форме.
Честно, сказать я тоже думаю над аналогичной задачей, но более сложной -
согласовать слова в генерируемом предложении. Я не уверен, что здесь
ispell-овского словаря хватит (т.е. не уверен, что у всех возможных
вариантов склонения падежи в одном и том же порядке перечислены).
--------------------------------------------------
Victor Wagner vitus@ice.ru
Programmer Office:7-(095)-964-0380
Institute for Commerce Home: 7-(095)-135-46-61
Engineering http://www.ice.ru/~vitus
=============================================================================
= Apache-Talk@lists.lexa.ru mailing list =
Mail "unsubscribe apache-talk" to majordomo@lists.lexa.ru if you want to quit.
= Archive avaliable at http://www.lexa.ru/apache-talk =