Стартап Thinking Machines Lab, основанный бывшим техническим директором OpenAI Мирой Мурати, представил первую демонстрацию своей новой модели, способной вести живой диалог. Она реагирует на пользователя в реальном времени, что позволяет сокращать задержку до 0,4 секунды, в отличие от 1,18 секунды у GPT-realtime-2.0. В блоге команда объяснила, что традиционные чатботы работают по очереди, что не подходит для живого общения, где важны интонации и жесты.
Модель Thinking Machines отказывается от классической схемы «вопрос-ответ», используя потоковую обработку данных. Она разбивает входящую информацию на части по 200 миллисекунд, обрабатывая их параллельно. Основная архитектура состоит из двух компонентов: TML-Interaction-Small, который взаимодействует в реальном времени, и фоновая модель, выполняющая более сложные задачи асинхронно.
На тестах TML-Interaction-Small показал высокие результаты, получив 77,8 балла на FD-bench V1.5, значительно опередив конкурентов. В ближайшие месяцы планируется ограниченное превью для партнеров, а полноценный релиз ожидается до конца года.