DeepSeek V3.2

Пользователи Cherry Studio теперь могут через встроенный CherryIN бесплатно опробовать сервис DeepSeek V3.2—— флагманская модель DeepSeek с разреженным вниманием MoE, выпущенная 1 декабря 2025 года, впервые нативно интегрирующая «мышление» в вызов инструментов; идеальный выбор для продвинутых Agent-сценариев и длинного контекста.


🚀 Что такое DeepSeek V3.2?

DeepSeek V3.2 основана на итерации V3.2-Exp, использует архитектуру Mixture-of-Experts (MoE) и внедряет DeepSeek Sparse Attention(DSA) механизм разреженного внимания, который заметно снижает стоимость вывода на длинном контексте при сохранении сверхкрупного общего числа параметров.

  • Архитектура: MoE + DeepSeek Sparse Attention(DSA)+ Multi-Head Latent Attention(MLA)

  • Общее число параметров: 685B

  • Активируемых параметров на токен: около 37B

  • Число экспертов: 256 экспертов на слой

  • Лицензия с открытым исходным кодом: MIT

  • Дата выпуска: 1 декабря 2025 года (V3.2-Exp выпущена 29 сентября 2025 года)

V3.2 также выпустила ориентированную на API DeepSeek-V3.2-Speciale версию, которая показала золотой уровень на сложных задачах рассуждения на IMO, CMO, ICPC World Finals и IOI 2025.


📚 Продолжение надежного процесса обучения и выравнивания

DeepSeek V3.2 унаследовала зрелый pipeline обучения серии V3 и добавила ключевые расширения для сценариев Agent:

  1. Масштабное предварительное обучение: базовое обучение на огромных высококачественных многоязычных корпусах, охватывающих код, математику и научные знания.

  2. Внедрение разреженного внимания: обучение основной модели и lightning indexer на длине последовательности 128K, при этом каждый query token выбирает 2048 key-value tokens для участия во внимании.

  3. Масштабная синтетическая генерация Agent-данных: новый метод синтетической генерации данных для обучения Agent, охватывающий более 1 800 сред и более 85 000 сложных инструкций.

  4. Интеграция мышления и вызова инструментов: V3.2 — первая модель DeepSeek, нативно интегрирующая «мышление» в вызов инструментов, поддерживающая использование инструментов как в «режиме мышления», так и в «безрежимном» режиме.


⚙️ Флагманские ключевые возможности

DeepSeek V3.2 делает ставку на комплексные возможности на уровне «сопоставимом с GPT-5» и значительно усиливает Agent и сложное рассуждение:

  • Нативное мышление + вызов инструментов: первая модель DeepSeek, интегрирующая thinking в tool-use

  • Топовые способности к рассуждению: V3.2-Speciale достигла золотого уровня на IMO / CMO / ICPC World Finals / IOI 2025

  • Код и задачи разработки: наследует сильные возможности V3 в коде

  • Стабильность на длинном контексте: способность DSA к анализу длинных документов и кодовых баз

  • Структурированный вызов инструментов: подходит для построения Agent с многократным планированием и выполнением


💡 DeepSeek Sparse Attention: длиннее, экономичнее

DSA — ключевое технологическое обновление V3.2, которое через lightning indexer + гранулярный выбор токенов реализует:

  • Впервые реализовано гранулярное разреженное внимание в крупной модели

  • Снижена основная сложность внимания с O(L²) до

  • Заметно ускорено обучение и вывод на длинном контексте при сохранении качества вывода, почти идентичного плотному вниманию

Сценарий
Рекомендуемый способ использования
Пример

Короткий диалог / простой вопрос-ответ

Прямой вызов

Повседневные вопросы, резюмирование

Задачи средней сложности

Включить вызов инструментов

Анализ данных, рефакторинг кода

Сложные Agent-задачи

Мышление + вызов инструментов

Многошаговое планирование, анализ кодовой базы, проверка длинных документов


🌟 Открыто, доступно, дружелюбно к экосистеме

  • ⚡ Ускорение вывода на длинном контексте благодаря DSA

  • 💰 Через CherryIN в Cherry Studioбесплатное использование

  • 🖥️ Открытые веса, лицензия MIT, Day-0 поддержка в основных фреймворках вывода, таких как vLLM, SGLang и др.


🧠 Фокус на практических возможностях: код и Agent

DeepSeek V3.2 особенно хорошо показывает себя в реальных рабочих процессах разработки:

  • Генерация и рефакторинг кода на нескольких языках

  • Понимание контекста на уровне репозитория и генерация патчей

  • Agent-инструменты: стабильный вызов внешних инструментов, поиск, выполнение кода

  • Математика и сложное рассуждение: поддержка задач соревновательного уровня


🧭 Как использовать в Cherry Studio?

  1. Откройте Cherry Studio и перейдите в Настройки → Сервисы моделей.

  2. Найдите CherryIN поставщика услуг и включите его.

  3. В списке моделей выберите DeepSeek V3.2.

  4. Вернитесь в чат и в верхнем выборе модели переключитесь на DeepSeek V3.2 — после этого можно начинать диалог.

💡 Подсказка: бесплатные квоты моделей, предоставляемые CherryIN, оплачиваются официально Cherry Studio и подходят для повседневного знакомства и оценки; для production-среды рекомендуется использовать вместе с официальным API DeepSeek.


📘 Попробуйте DeepSeek V3.2 прямо сейчас и начните путешествие в мир флагманского рассуждения и Agent!

Последнее обновление

Это было полезно?