• Стр. 93-102

Метод автоматической классификации коротких текстовых сообщений

Э. Мбайкоджи, А.А. Драль, И.В. Соченков

Аннотация

В статье представлены результаты исследования в области классификации коротких текстовых документов. Проанализированы методы классификации на основе анализа распределения лексических дескрипторов естественного языка. Описан метод оценки информационной значимости в текстах естественного языка. Представлен метод классификации текстовых документов на основе характеристики тематической значимости.

Ключевые слова

классификация коротких текстовых документов, классификация по метаданным, мультиномиальная модель, метод опорных векторов, TF, IDF, характеристика тематической значимости