Lossfunk представляет EsoLang-Bench: эффективность ИИ на эзотерических языках

Лаборатория ИИ Lossfunk анонсировала EsoLang-Bench — бенчмарк, состоящий из 80 задач, разработанных на пяти эзотерических языках программирования: Brainfuck, Befunge-98, Whitespace, Unlambda и Shakespeare. Пять передовых моделей, включая GPT-5.2 и Gemini 3 Pro, показали точность от 0 до 11% на этих задачах, которые любой студент запросто решит на Python за считанные минуты. Ни одна из моделей не справилась с задачами, превышающими уровень Easy.