Что нового в Qwen 3?

Двойные режимы «мышления»

Одна из самых крутых особенностей: Qwen 3 может переключаться между режимом «с мышлением» и «без мышления». Режим с мышлением предназначен для глубоких рассуждений, например, пошаговых ответов на сложные задачи. Режим без мышления пропускает лишнее и даёт быстрые и лаконичные ответы.

В зависимости от запроса или задачи, Qwen 3 может либо глубоко анализировать, либо сразу переходить к сути. Это значит — высокая скорость, когда она нужна, и глубина, когда она требуется.

MoE для эффективного масштабирования

Архитектура MoE (Mixture-of-Experts) позволяет Qwen3 работать с огромным количеством параметров. Вместо использования всех параметров каждый раз, модель активирует лишь несколько «экспертов» на каждый токен. Например, Qwen3-235B задействует только 22 млрд активных параметров одновременно, что делает её работу гораздо экономичнее, чем можно ожидать для модели такого размера.

Это умный способ масштабирования без лишних затрат на GPU.

Обучение на 36 триллионах токенов на 119 языках

Qwen 3 обучалась на огромном датасете объёмом около 36 триллионов токенов, включающем веб-данные, книги, PDF-файлы и синтетические данные по коду и математике, сгенерированные предыдущими версиями Qwen. Теперь модель понимает 119 языков и диалектов, что делает её одной из самых многоязычных моделей в мире.

Работаете ли вы с английским, китайским или малоресурсным языком — Qwen 3, скорее всего, готова помочь.

Умнее как агент и сильнее в программировании

Qwen 3 обучалась не только для общения. Alibaba также сосредоточилась на использовании инструментов, планировании и программировании, благодаря чему новое поколение стало значительно лучше в таких задачах, как:

Более того, даже Qwen3-4B, по сообщениям, превосходит некоторые предыдущие 72B-модели в задачах, связанных с программированием.

Заключение

Qwen 3 — одна из лучших открытых языковых моделей на данный момент. Конечно, учитывая скорость выхода новых моделей, это, вероятно, скоро изменится.

Картинка к сообщению Что нового в Qwen 3?

Что нового в Qwen 3?

Популярные сегодня темы