Преобразование сырых текстовых данных в инструкционный датасет для дообучения модели-генератора. предназначенной для работы в системе RAG
Язык статьиРусский
Аннотация
В статье описан метод построения инструкционного датасета для дообучения большой языковой модели (LLM), предназначенной для выполнения роли генератора в системе RAG. Также представлена практическая реализация предложенного метода на примере построения датасета для дообучения модели-генератора для работы в системе RAG корпоративного интеллектуального ассистента.
Ключевые слова
DOI10.31144/si.2307-6410.2025.n27.p77-92
УДК004.853
Номер
№ 27,
Страницы77-92
Файл
eliseevmaksimovabondarenko.pdf
(526.81 КБ)
Библиографическая ссылка
Елисеев В.О., Максимова А.Ю., Бондаренко В.И. Преобразование сырых текстовых данных в инструкционный датасет для дообучения модели-генератора. предназначенной для работы в системе RAG // Системная информатика, 2025. – № 27. – С. 77-92. – DOI: https://doi.org/10.31144/si.2307-6410.2025.n27.p77-92.