Задача кластеризации текстовых документов

    М.В. Хачумов1), 2)

    1) Федеральный исследовательский центр "Информатика и управление" Российской академии наук, г. Москва, Россия
    2) Российский институт дружбы народов, г. Москва, Россия
    Аннотация

    В статье рассмотрены вопросы совершенствования технологии кластеризации тек-стовых документов на основе оптимизации числа кластеров и их первоначального размещения, а также выбора наиболее адекватных метрик. Полученные в ходе экспериментов результаты под-тверждают эффективность предложенного подхода.

    Ключевые слова

    текст, кластеризация, класс, вектор, метрика, центр кластера, рубрика, эксперимент