Извлечение информации из научных текстов на русском языке

Извлечение информации из научных текстов на русском языке

Язык статьи
Русский
Аннотация
В статье описаны методы автоматического извлечения терминов и связывания их с Викиданными. Преимуществом предложенных методов является потенциальная возможность их применения к любым областям знаний при наличии только неразмеченных текстов и начальных словарей терминов небольшого размера. Для проведения экспериментов был собран и размечен корпус научных текстов RuSERRC. Корпус и модели находятся в открытом доступе и могут быть полезны для дальнейших исследований другими научными коллективами.
DOI
10.31144/si.2307-6410.2021.n19p57-70
УДК
Страницы
57-70
Файл
batura2021.pdf501.9 КБ
Номер