DeepSeek V3.1: гибридный ИИ для китайских чипов и агентных задач

Компания DeepSeek представила обновлённую версию своего флагманского ИИ — модель DeepSeek V3.1. Главное нововведение — гибридная архитектура вывода, позволяющая переключаться между режимами с рассуждением и без. Это делает систему быстрее в простых задачах и глубже в сложных логических или многоэтапных операциях.

Пользователи могут вручную активировать «глубокое мышление» через кнопку в мобильном приложении и на веб-платформе. По умолчанию модель автоматически выбирает оптимальный режим в зависимости от запроса. Такой подход снижает задержки и вычислительные затраты, когда мощный анализ не требуется.

Обновлённая версия поддерживает контекстное окно до 128 тысяч токенов в обоих режимах. Дополнительное обучение улучшило способность модели работать с длинными текстами и сложными задачами. Ранние тесты показывают прогресс в логике, написании кода и использовании инструментов.

Особое внимание в анонсе уделено совместимости с китайскими чипами. Использование формата точности FP8, в частности UE8M0, оптимизировано под будущие поколения отечественных ускорителей. Это часть стратегии снижения зависимости от иностранных компонентов.

Точные модели чипов не раскрываются, но акцент на локальное железо указывает на ориентацию на внутренний рынок. Эффективность на отечественных акселераторах должна повыситься за счёт более плотного формата данных и оптимизированного вывода.

Модель сохранила архитектуру с 671 миллиардом параметров, из которых 37 миллиардов активны. При этом она прошла дополнительную дообучку на 840 миллиардах токенов. По оценкам, V3.1 превосходит предыдущую версию R1 в скорости и качестве рассуждений.

Несмотря на улучшения, некоторые обзоры отмечают, что DeepSeek V3.1 пока уступает топовым западным аналогам в отдельных тестах. Однако развитие агентных возможностей и поддержка инструментов открывают потенциал для роста.

Для разработчиков гибридный режим означает экономию ресурсов: сложные вычисления включаются только по необходимости. С 6 сентября 2025 года вступают в силу изменения в API-тарифах, что даёт командам время на пересмотр бюджетов.

Остаются вопросы: какие именно чипы будут поддерживаться, какая доля трафика пойдёт через режим рассуждений и как именно реализована вызов функций в этом режиме. Полная документация по пропускной способности и ограничениям памяти ожидается позже.

Также не раскрыта детальная ценовая сетка для API. Неясна и региональная доступность на облачных платформах, а также перспективы локального запуска модели на устройствах. Эти аспекты станут ключевыми для интеграторов.

Гибкость, ориентация на отечественное железо и готовность к агентному взаимодействию делают DeepSeek V3.1 важным шагом в развитии китайских ИИ-систем. Успех будет зависеть от прозрачности, реальной производительности и поддержки экосистемы.

Подписаться
Уведомить о
guest

0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии
Прокрутить вверх