Google DeepMind объявил о публикации предварительного прототипа SIMA-2 (Scalable Instructable Multiworld Agent) — следующего поколения агента, который, по словам создателей, «переходит за рамки простого исполнения инструкций, чтобы понимать и взаимодействовать с окружающей средой».
SIMA-1, представленный в марте 2024 года, обучался на сотнях часов видеоигр и смог выполнять простые команды во множестве 3-D игр, но в сложных задачах завершал их только 31% случаев, в то время как люди достигают 71%.
«SIMA-2 — это шаг в сторону более универсального агента, способного решать сложные задачи в ранее незнакомых средах и самосовершенствоваться на основе собственного опыта», — заявил старший исследователь Джо Марино.
Агент создан на базе Gemini 2.5 flash-lite, «общего искусственного интеллекта» (AGI) — системы, способной выполнять широкий спектр интеллектуальных задач, учиться новому и перенимать знания в разных областях. Марино пояснил, что работа с агентами в виртуальных средах важна для достижения интеллекта: «В виртуальном пространстве агент взаимодействует с физическим или виртуальным миром через органы чувств и действия, как робот или человек, в отличие от "не-тела-в-виртуальном" агента, который может, например, редактировать календарь».