Публикации
Турдаков Д.
Устранение лексической многозначности терминов Википедии на основе скрытой модели Маркова
В статье описывается способ автоматического устранения лексической многозначности терминов естественного языка, использующий открытую энциклопедию Википедию. Рассматриваются проблемы применения существующих алгоритмов, и предлагается собственный метод, основанный на скрытой модели Маркова, параметры которой вычисляются на основе словаря и ссылочной структуры Википедии. Также, предлагается эвристика для ускорения описанного алгоритма, и приводятся экспериментальные оценки точности на различных тестовых корпусах.

Устранение лексической многозначности терминов Википедии на основе скрытой модели Маркова (225 Kb, скачиваний: 130)

Последние изменения: 16 октября 2009