Новая модель от Thinking Machines Lab демонстрирует живое взаимодействие

Стартап Thinking Machines Lab, основанный бывшим техническим директором OpenAI Мирой Мурати, представил первую демонстрацию своей новой модели, способной вести живой диалог. Она реагирует на пользователя в реальном времени, что позволяет сокращать задержку до 0,4 секунды, в отличие от 1,18 секунды у GPT-realtime-2.0. В блоге команда объяснила, что традиционные чатботы работают по очереди, что не подходит для живого общения, где важны интонации и жесты.

Модель Thinking Machines отказывается от классической схемы «вопрос-ответ», используя потоковую обработку данных. Она разбивает входящую информацию на части по 200 миллисекунд, обрабатывая их параллельно. Основная архитектура состоит из двух компонентов: TML-Interaction-Small, который взаимодействует в реальном времени, и фоновая модель, выполняющая более сложные задачи асинхронно.

На тестах TML-Interaction-Small показал высокие результаты, получив 77,8 балла на FD-bench V1.5, значительно опередив конкурентов. В ближайшие месяцы планируется ограниченное превью для партнеров, а полноценный релиз ожидается до конца года.