Прорыв или иллюзия? Новая архитектура ИИ меняет правила игры
Когда кажется, что мир искусственного интеллекта уже достиг предела возможного, на горизонте возникает новый игрок. Система иерархической модели рассуждений (HRM), созданная исследователями компании Sapient, неожиданно обошла ведущие языковые модели в тесте, который считается едва ли не «лакмусовой бумажкой» на пути к искусственному общему интеллекту (AGI).
Именно поэтому её появление вызвало такой резонанс. Парадокс в том, что HRM не гигант с триллионами параметров, а компактная система с всего 27 миллионами параметров. Для сравнения: современные модели, вроде GPT-5, имеют триллионы. Таким образом, возникает вопрос: как же «маленькая» HRM смогла обыграть признанных чемпионов?
Машины против мозга: в поисках нового подхода
Большинство современных моделей обучаются на огромных массивах данных. Их сила в масштабе: чем больше текстов и параметров, тем лучше результат. Однако такой путь не бесконечен. С ростом объёмов системы становятся всё более громоздкими, энергоёмкими и дорогими в поддержке.
Вместо этого HRM пошла другим путём. Она не стремится копировать всё подряд, а пытается имитировать принципы человеческого мышления. Её архитектура напоминает работу мозга, потому что в ней есть чёткое разделение ролей:
-
модуль высокого уровня отвечает за абстрактное планирование,
-
модуль низкого уровня — за быстрые вычисления и детали.
Таким образом, модель работает почти так же, как человек: сначала обдумывает стратегию, а затем выполняет конкретные действия.
Испытание ARC-AGI: экзамен для будущего интеллекта
Тест, в котором проверили HRM, называется ARC-AGI. Это не просто набор задач, а попытка измерить, насколько близко та или иная модель подошла к настоящему искусственному общему интеллекту.
Результаты оказались неожиданными. В первой версии теста HRM получила 40,3 % баллов. Для сравнения:
-
OpenAI o3-mini-high — 34,5 %,
-
Claude 3.7 от Anthropic — 21,2 %,
-
Deepseek R1 — 15,8 %.
Во второй, более сложной версии HRM также обошла конкурентов. Пусть показатели и скромные (5 % против 3 % у ближайшего соперника), но разрыв очевиден.
Следовательно, речь идёт не о случайности, а о закономерной тенденции. Ведь тест ARC-AGI проверяет не запоминание фактов, а именно способность рассуждать и находить решения.
Судоку, лабиринты и настоящие чудеса
Чтобы понять уникальность HRM, достаточно взглянуть на задачи, где она проявила себя особенно ярко.
-
Она почти идеально решает судоку, с которым классические языковые модели до сих пор испытывали трудности.
-
Она уверенно находит оптимальные пути в лабиринтах, демонстрируя стратегическое мышление.
Более того, HRM показывает, что способна работать там, где другие модели сдаются. Поэтому учёные всё чаще говорят: перед нами возможный зачаток нового класса ИИ.
Почему старый метод больше не работает
До сих пор основным способом «научить» модели рассуждать был метод цепочки рассуждений (Chain of Thought, CoT). Его суть проста: сложная задача разбивается на несколько простых шагов, описанных на естественном языке.
С одной стороны, такой подход выглядит логичным и напоминает школьное решение уравнения. С другой стороны, у CoT есть слабые места:
-
нестабильность декомпозиции,
-
огромные требования к данным,
-
задержки при генерации ответа.
Именно поэтому Sapient предложила отказаться от излишних «словесных цепочек». HRM решает задачи за один проход, постепенно уточняя ответ с помощью коротких циклов «размышлений». В итоге модель экономит ресурсы и работает быстрее.
Маленькая, но умная: 27 миллионов параметров против триллионов
Цифры впечатляют и одновременно удивляют.
-
GPT-5 по слухам имеет от 3 до 5 триллионов параметров.
-
HRM довольствуется 27 миллионами.
На первый взгляд разница кажется катастрофической. Однако именно компактность дала HRM неожиданное преимущество. Она быстрее обучается, требует меньше энергии и при этом справляется с тестами лучше.
Таким образом, мы видим типичную ситуацию в спорте: гигант может быть сильнее, но ловкий и умный соперник часто выигрывает за счёт тактики.
Вдохновение в биологии: как мозг подсказывает инженерам путь
Человеческий мозг давно служит вдохновением для инженеров. Искусственные нейронные сети появились именно как попытка смоделировать работу нейронов. Но HRM делает шаг дальше.
Она учитывает иерархическую структуру мышления. Наш мозг постоянно балансирует между «медленным» аналитическим и «быстрым» интуитивным мышлением. Психолог Даниэль Канеман описал это в книге «Думай медленно… решай быстро». HRM словно перенесла этот принцип в цифровую среду.
Поэтому многие специалисты считают: появление HRM может означать начало новой эры — от грубой силы к умным архитектурам, которые используют меньше ресурсов, но рассуждают эффективнее.
История повторяется: от паровоза до ИИ
Чтобы лучше понять значимость HRM, стоит вспомнить историю технологий.
-
XIX век: паровозы стали символом индустриализации.
-
XX век: электровозы и компьютеры изменили картину мира.
-
XXI век: гонка идёт за искусственным интеллектом.
Каждый раз побеждала не просто сила, а новый принцип работы. Паровозы выиграли у конной тяги не скоростью, а возможностью тянуть десятки вагонов. Компьютеры победили арифмометры не изяществом, а универсальностью.
Таким образом, HRM показывает: следующий скачок может прийти не от «раздувания» параметров, а от умной имитации мозга.
Сомнения и критика: не всё так гладко
Однако научное сообщество не спешит объявлять победу HRM. Исследование опубликовано лишь как препринт на arXiv, оно не прошло полноценную экспертную проверку.
Более того, организаторы теста ARC-AGI попытались воспроизвести результаты и наткнулись на странность. С одной стороны, они подтвердили показатели HRM. С другой стороны, выяснилось: дело может быть не только в архитектуре. В процессе обучения модель прошла недокументированную доработку, которая сильно повлияла на результаты.
Поэтому возникли вопросы:
-
насколько честно проведено сравнение,
-
повторимы ли результаты,
-
и действительно ли именно «иерархичность» стала ключом к успеху.
Перспективы: шаг к искусственному общему интеллекту
Несмотря на критику, факт остаётся фактом: HRM доказала, что компактная и «умная» архитектура может конкурировать с гигантами.
Если подход оправдает себя, то в будущем возможны:
-
эффективные малые модели для конкретных задач,
-
новые принципы обучения, основанные не на объёме данных, а на структуре,
-
ускорение прогресса к AGI — системе, которая сможет решать задачи так же гибко, как человек.
Аналогия с природой: меньше значит больше
В природе часто побеждает не самый сильный, а самый приспособленный. Дельфины, имея мозг меньше человеческого, демонстрируют выдающийся интеллект. Муравьи, обладая микроскопическим мозгом, строят сложные колонии.
Поэтому HRM напоминает эти примеры: маленькая, но способная обыграть «тяжеловесов». Таким образом, мы видим возможный поворотный момент в развитии технологий.
Кто выиграет от новой парадигмы
Появление HRM важно не только для науки. Оно открывает двери для целых стран и компаний, которые не могут позволить себе триллионные модели.
Если компактные и умные архитектуры войдут в практику, то:
-
малые государства смогут создавать собственные ИИ,
-
стартапы получат шанс конкурировать с корпорациями,
-
рынок станет более разнообразным и конкурентным.
Таким образом, будущее искусственного интеллекта может стать более демократичным.
Шаг в сторону или шаг вперёд?
История HRM — это напоминание: в технологиях выигрывает не всегда тот, у кого больше ресурсов. Иногда достаточно найти новый принцип.
Сегодня HRM — лишь экспериментальная система, чьи результаты ещё предстоит проверить. Однако сама идея, что маленькая модель может рассуждать как человек, звучит революционно.
Если этот путь подтвердится, то в ближайшие годы мы станем свидетелями настоящего перелома. Мир искусственного интеллекта может уйти от гонки «больше данных и параметров» и перейти к гонке за эффективностью и интеллектуальностью.
И тогда окажется, что будущее ИИ ближе, чем мы думали.
Этот материал подготовлен без спонсоров и рекламы. Если считаете его важным — вы можете поддержать работу редакции.
Ваша поддержка — это свобода новых публикаций. ➤ Поддержать автора и редакцию
Мониторинг информации из различных источников, включая зарубежную прессу, анализ и проверка достоверности данных, создание и редактирование новостных материалов.


