Meta* представила Llama 4: ИИ анализирует 48 изображений за раз, говорит на 200 языках и обгоняет GPT-4o

ixbt 05.04.2025 23:00 9

Meta* анонсировала новое поколение мультимодальных моделей Llama 4, способных обрабатывать текст, изображения и видео в беспрецедентных масштабах. Две ключевые модели — Llama 4 Scout и Maverick — уже доступны для разработчиков на платформах llama.com и Hugging Face, а в ближайшие дни появятся в сервисах Meta AI (WhatsApp, Messenger, Instagram*). Главное отличие от предшественников — раннее слияние модальностей: вместо раздельной обработки текста и изображений модель учится понимать их совместно, как человек, который изучает предмет через контекст.

Llama 4 Scout при компактных 17 млрд активных параметров (из 109 млрд общих) способна анализировать до 48 изображений за запрос и работает даже на одной видеокарте NVIDIA H100. Это делает её быстрее Google Gemma 3 с 27 млрд параметров, хотя версии для смартфонов пока нет. Контекстное окно Scout расширено до 10 млн токенов — эквивалент 20 часов видео или 5000 страниц текста. В тестах модель демонстрирует 100% точность в поиске информации в гигантских массивах данных и переводит редкие языки по методическим пособиям.

Изображение: Meta*

Llama 4 Maverick (400 млрд общих параметров, из которых активны 17 млрд) заняла 2-е место в рейтинге LMSYS Arena, набрав 1417 баллов ELO — уровень GPT-4.5, но ниже Gemini 2.5 Pro. Модель оптимизирована для серверов: обрабатывает 10 млн токенов контекста, решает логические задачи и генерирует код. Для запуска хватит одной DGX-ноды с 8 GPU H100. Качество достигнуто благодаря дистилляции от Llama 4 Behemoth — гиганта с 2 трлн параметров, который дообучается на 32 тыс. видеокарт с точностью FP8. Инженеры Meta сократили 95% данных при его посттренинге, оставив только сложные STEM-задачи, что ускорило обучение в 10 раз.

Обе модели обучены на 30 трлн токенов — вдвое больше, чем у Llama 3. Датасет включает 200 языков, причём для 100 из них собрано минимум по 1 млрд примеров. Это открывает возможности для приложений в регионах, где ИИ ранее «не говорил» на местных наречиях. Для безопасности реализованы инструменты Llama Guard (блокировка вредных запросов) и Prompt Guard (защита от инъекций), а частота отказов на спорные темы снижена с 7% до 2%.

29 апреля на LlamaCon Meta представит ИИ с продвинутым логическим мышлением. Как отметил Марк Цукерберг, это будут модели, которые не просто отвечают, но рассуждают. Анонс Llama 4 — шаг к экосистеме, где узкие «эксперты» заменят универсальные алгоритмы, сократив стоимость владения на 40%. Уже сейчас Scout и Maverick позволяют создавать приложения для медицины, анализа Big Data и мультиязычного перевода — там, где раньше требовались облачные кластеры.

* Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена

Original: iXBT.com: новости

Средний рейтинг 0

Публичные новости

Meta* представила Llama 4: ИИ анализирует 48 изображений за раз, говорит на 200 языках и обгоняет GPT-4o

Комментарии:

Здесь нет комментариев.

Добавить комментарий