Извлечение информации из научных текстов на русском языке

Извлечение информации из научных текстов на русском языке
Язык статьиРусский
Аннотация

В статье описаны методы автоматического извлечения терминов и связывания их с Викиданными. Преимуществом предложенных методов является потенциальная возможность их применения к любым областям знаний при наличии только неразмеченных текстов и начальных словарей терминов небольшого размера. Для проведения экспериментов был собран и размечен корпус научных текстов RuSERRC. Корпус и модели находятся в открытом доступе и могут быть полезны для дальнейших исследований другими научными коллективами.

DOI10.31144/si.2307-6410.2021.n19p57-70
УДК004.912
Номер № 19,
Страницы57-70
Файл batura2021.pdf (501.9 КБ)