Системная информатика, 16.07.2025, № 27
Статья посвящена авторским результатам анализа генетически наследуемой способности живых тел к деятельности интеллектуального характера (например, способности к эхолокации у дельфинов), в результате которых возникли алгебраические формализмы, именуемые тензор-унитарными преобразованиями. Под генетическим интеллектом понимается та часть интеллектуальных потенций живых организмов, которая позволяет на основе генетической информации в молекулах ДНК и РНК выстроить, например, из одной оплодотворенной клетки организм с триллионами клеток так, что в нем многоканальным помехоустойчивым образом воспроизводятся родительские признаки, несмотря на сильные шумы и постоянно меняющиеся по ходу жизни условия питания и внешних воздействий. Речь при этом идет о систематическом росте по ходу онтогенеза количества параметров и степеней свободы тела с соответствующим увеличением размерности его конфигурационного пространства состояний. При таком росте организм на очередных стадиях своего развития, обретая новые степени свободы и знания, каким-то образом сохраняет память об умениях и знаниях, которыми он обладал на предыдущих этапах жизни. Автор развивает алгебраические основы моделирования этой фундаментальной особенности развития живых тел на тензор-матричном языке систем многомерных векторных конфигурационных пространств. Тензор-унитарные преобразования являются операторами, сохраняющими длины векторов при их тензорном преобразовании в векторы пространства повышенной размерности (в отличие от обычных унитарных преобразований, трансформирующих вектора в пространство той же размерности). Они являются операторами расширения стохастико-детерминистской памяти с сохранением всей предыдущей памяти. Обсуждаются возможные приложения тензор-унитарных преобразований для развития ИИ, генетических алгоритмов и пр.
Направленные бинарные категорные склейки, принцип двойственности и категорная модель нейронных сетей
Теория категорных систем, развиваемая автором, позволяет естественным образом смоделировать традиционные искусственные нейронные сети произвольной топологии, сети живых нейронов, у которых помимо спайковой коммуникации имеется несколько десятков других видов клеточной коммуникации, а также сетевые структуры, аналогичные высшим категориям. Математическим аппаратом категорных систем является теория категорных склеек, данная работа посвящена следующим вопросам этой теории. Вводятся и изучаются направленные бинарные категорные склейки, являющиеся обобщением обычных категорий, в теории которых, как известно, большую роль играет понятие дуальности категорий и принцип двойственности, основанный на дуальности. В теории категорных склеек помимо дуальности аналогичной дуальности, порождаемой заменой направления стрелок категории, имеется новый вид дуальности, связанный с заменой имен стрелок на имена свёрток, обобщающих обычную операцию композиции. Проведено построение дуальных в обоих смыслах категорных склеек изучаемого типа, доказаны теоремы, отвечающие принципам двойственности для указанных двух видов дуальности. Теоремы приведены в рамках теории доказательств, для частного случая обычных категорий дающие новые доказательства принципа двойственности. Обобщение подхода на свёрточные аналоги мультикатегорий находят приложения в нейронных сетях, в частности, для известных формул С. Осовского в методе обратного распространения ошибки.
В работе исследуется подход адаптации больших языковых моделей (LLM) для запросов в математической предметной области. Предметная область представлена в виде онтологии семантической библиотеки LibMeta, навигация по данным в которой осуществляется с помощью графа знаний (KG) MathSemanticLib. Описания математической предметной области основаны на математических энциклопедиях советской и российской математических школ, а наполнение библиотеки предметной области LibMeta осуществляется путем интеграции предметных областей специализированных математических журналов. Предложена процедура интеграции LLM и KG MathSemanticLib. Показано, что в результате такого подхода LLM не выходит за рамки предметной области, что позволяет сформулировать более релевантный ответ на запрос.
В статье описан метод построения инструкционного датасета для дообучения большой языковой модели (LLM), предназначенной для выполнения роли генератора в системе RAG. Также представлена практическая реализация предложенного метода на примере построения датасета для дообучения модели-генератора для работы в системе RAG корпоративного интеллектуального ассистента.
В статье исследуется проблема создания надежного искусственного интеллекта на основе больших языковых моделей и p-вычислимых проверяющих процедур. Для этой цели мы представляем концепцию программной платформы для надежной проверки ответов, полученных большими языковыми моделями. Мы фокусируемся на применении этой программной платформы к системам цифровых двойников, особенно для умных городов, где большие языковые модели еще не получили широкого распространения из-за их ресурсоемкости и потенциала галлюцинаций. Принимая во внимание тот факт, что проверка решения из соответствующего набора задач является p-вычислимой и в большинстве случаев менее сложной, чем вычисление и реализация всей задачи, мы представляем методологию, которая использует проверяющие процедуры для оценки достоверности решений, сгенерированных большими языковыми моделями. Эти проверяющие системы реализованы с помощью методологии полиномиального программирования на полных по Тьюрингу языках и гарантируют полиномиальную по времени сложность. Наша система была протестирована на задаче 2-SAT. Наша программная платформа предлагает масштабируемый способ реализации надежных систем искусственного интеллекта с гарантированной полиномиальной сложностью, обеспечивая обнаружение ошибок и предотвращая сбои системы.