В статье представлены результаты исследования изменений, происходящих в тематических кластерах, построенных на коллекции текстов конференций предметной области Argument mining. Выявление терминов, установление связей между ними и тематическая кластеризация проведены с помощью сторонних программных средств, позволяющей извлекать термины в форме именных словосочетаний, проводить их кластеризацию на базе алгоритма, основанного на применении функции модулярности. Приводится оценка качества полученных кластеров по трем критериям. Трансформацию терминологического состава кластеров во времени предлагается анализировать с помощью ориентированных графов, построенных на основе критерия, который позволяет фиксировать наиболее важные изменения. Терминологическая лексика выявленных тематических кластеров характеризует отдельные направления, в которых ведутся исследования, а трансформация терминологического состава кластеров во времени демонстрирует смещение интересов.
Анализ тематических кластеров текстовых коллекций и исследование временно`й динамики тем (на материалах конференций по Argument Mining)
Анализ тематических кластеров текстовых коллекций и исследование временно`й динамики тем (на материалах конференций по Argument Mining)
Язык статьиРусский
Аннотация
Ключевые слова
DOI10.31144/si.2307-6410.2019.n15.p65-78
УДК81'322.2
Номер
№ 15,
Страницы65-78
Файл
pimenovsalomatinasidorova.pdf
(520.75 КБ)
Библиографическая ссылка
Пименов И.С., Саломатина Н.В., Сидорова Е.А. Анализ тематических кластеров текстовых коллекций и исследование временно`й динамики тем (на материалах конференций по Argument Mining) // Системная информатика, 2019. – № 15. – С. 65-78. – DOI: https://doi.org/10.31144/si.2307-6410.2019.n15.p65-78.