Метод тематической кластеризации масштабных коллекций научно-технических документов

    Д.А. Девяткин, Р.Е. Суворов, И.В. Соченков

    Аннотация

    В статье представлены результаты исследования в области методов тематической кластеризации научно-технических документов. Сформулированы требования к реализации методов кластеризации масштабных коллекций документов в поисково-аналитических системах. Предложен метод и разработан алгоритм тематической кластеризации масштабных коллекций научно-технических документов в поисково-аналитической системе. Выполнено экспериментальное сравнение результатов работы предложенного метода с несколькими классическими методами кластеризации текстов.

    Ключевые слова

    кластеризация, классификация, дескриптор, спектральный индекс, тематическая значимость