Вышла Llama 4 - мультимодальная большая языковая модель

Согласно тестам, Llama 4 Maverick (400B) демонстрирует производительность примерно на уровне DeepSeek v3.1 при схожих или даже более низких ценах, что делает его очевидным конкурентом. Он превосходит DeepSeek v3.1 благодаря мультимодальности и поддержке контекста длиной 1 млн токенов.

Llama 4 Scout (109B) показывает немного лучшие результаты в тестах по сравнению с Llama 3.3 70B, но теперь ещё и поддерживает мультимодальность и обладает огромной длиной контекста (10 млн токенов).

Llama 4 Behemoth (2T) опережает все модели — Claude Sonnet 3.7, Gemini 2.0 Pro и GPT-4.5 — в выбранных для сравнения тестах.

Это крупные MOE (Mixture of Experts) с возможностью обработки изображений, но без вывода изображений

Llama 4 Scout: 109B + контекст 10M → 17B активных параметров.

Llama 4 Maverick: 400B + контекст 1M → тоже 17B активных параметров! Потому что в ней просто БОЛЬШЕ экспертов.

Behemoth 2T → 288B активных параметров!

Llama 4 параметры

Картинка к сообщению Вышла Llama 4

Вышла Llama 4

Популярные сегодня темы