Ведущие компании в области искусственного интеллекта – OpenAI, Google, Anthropic – последние годы увеличивают вычислительные мощности для улучшения языковых моделей. Однако этот подход лишь устраняет поверхностные ошибки, порождая более глубокие и труднообнаружимые сбои в работе моделей.
Новые языковые модели кажутся умнее, но на деле лишь создают более изощрённые галлюцинации: с каждым релизом уровень выдуманных ответов растёт. Например, одна из последних моделей OpenAI показала до 50% вымышленных ответов на собственном тесте SimpleQA.
Проблема в том, что современные модели работают в «замороженном» режиме: после обучения их параметры не обновляются в реальном времени. Это приводит к устареванию знаний и ошибкам в динамично изменяющемся мире.
Решение предлагают новые ИИ-архитектуры, основанные на байесовском подходе и метрике Фишера, которые меняют пространство вычислений с плоской евклидовой геометрии на изогнутую информационно-теоретическую. Такой подход позволяет моделям непрерывно обновлять свои убеждения и адаптироваться к новым данным.
Компании VERSES AI, causalLens, Symbolica AI и Layer 6 AI уже внедряют эти технологии, показывая высокую эффективность и точность в задачах обучения и принятия решений. Microsoft также обладает инструментами для масштабного применения таких решений, но пока ограничен инженерными сложностями.
Таким образом, индустрия ИИ стоит на пороге смены парадигмы: от статичных языковых моделей к живым, адаптирующимся системам, способным работать в реальном времени и учитывать неопределённость. Проблема давно не в вычислениях, а в самих основах модели и пространстве, в котором они работают.