Проблемы извлечения терминологического ядра предметной области из электронных энциклопедических словарей
Язык статьи
Русский
Аннотация
Статья посвящена проблемам автоматического построения терминологической системы предметной области. Предложен метод извлечения терминов предметной области на базе электронных энциклопедических источников данных. Особенностью предлагаемого подхода является тщательный анализ структуры термина, распознавание ошибок на базе их лингвистической классификации, автоматическая генерация лексико-синтаксических шаблонов, представляющих многокомпонентные термины, и использование набора эвристических методов обработки «особых» терминов. Использование энциклопедических словарей позволяет автоматически сформировать эталонный список наименований понятий и применять его для оценки качества формируемых словарей.
Ключевые слова
DOI
10.31144/si.2307-6410.2018.n13.p49-76
Страницы
49-76
Номер