DeepSeek V3.2
Пользователи Cherry Studio теперь могут через встроенный CherryIN бесплатно опробовать сервис DeepSeek V3.2—— флагманская модель DeepSeek с разреженным вниманием MoE, выпущенная 1 декабря 2025 года, впервые нативно интегрирующая «мышление» в вызов инструментов; идеальный выбор для продвинутых Agent-сценариев и длинного контекста.
🚀 Что такое DeepSeek V3.2?
DeepSeek V3.2 основана на итерации V3.2-Exp, использует архитектуру Mixture-of-Experts (MoE) и внедряет DeepSeek Sparse Attention(DSA) механизм разреженного внимания, который заметно снижает стоимость вывода на длинном контексте при сохранении сверхкрупного общего числа параметров.
Архитектура: MoE + DeepSeek Sparse Attention(DSA)+ Multi-Head Latent Attention(MLA)
Общее число параметров: 685B
Активируемых параметров на токен: около 37B
Число экспертов: 256 экспертов на слой
Лицензия с открытым исходным кодом: MIT
Дата выпуска: 1 декабря 2025 года (V3.2-Exp выпущена 29 сентября 2025 года)
V3.2 также выпустила ориентированную на API DeepSeek-V3.2-Speciale версию, которая показала золотой уровень на сложных задачах рассуждения на IMO, CMO, ICPC World Finals и IOI 2025.

📚 Продолжение надежного процесса обучения и выравнивания
DeepSeek V3.2 унаследовала зрелый pipeline обучения серии V3 и добавила ключевые расширения для сценариев Agent:
Масштабное предварительное обучение: базовое обучение на огромных высококачественных многоязычных корпусах, охватывающих код, математику и научные знания.
Внедрение разреженного внимания: обучение основной модели и lightning indexer на длине последовательности 128K, при этом каждый query token выбирает 2048 key-value tokens для участия во внимании.
Масштабная синтетическая генерация Agent-данных: новый метод синтетической генерации данных для обучения Agent, охватывающий более 1 800 сред и более 85 000 сложных инструкций.
Интеграция мышления и вызова инструментов: V3.2 — первая модель DeepSeek, нативно интегрирующая «мышление» в вызов инструментов, поддерживающая использование инструментов как в «режиме мышления», так и в «безрежимном» режиме.

⚙️ Флагманские ключевые возможности
DeepSeek V3.2 делает ставку на комплексные возможности на уровне «сопоставимом с GPT-5» и значительно усиливает Agent и сложное рассуждение:
✅ Нативное мышление + вызов инструментов: первая модель DeepSeek, интегрирующая thinking в tool-use
✅ Топовые способности к рассуждению: V3.2-Speciale достигла золотого уровня на IMO / CMO / ICPC World Finals / IOI 2025
✅ Код и задачи разработки: наследует сильные возможности V3 в коде
✅ Стабильность на длинном контексте: способность DSA к анализу длинных документов и кодовых баз
✅ Структурированный вызов инструментов: подходит для построения Agent с многократным планированием и выполнением

💡 DeepSeek Sparse Attention: длиннее, экономичнее
DSA — ключевое технологическое обновление V3.2, которое через lightning indexer + гранулярный выбор токенов реализует:
Впервые реализовано гранулярное разреженное внимание в крупной модели
Снижена основная сложность внимания с O(L²) до
Заметно ускорено обучение и вывод на длинном контексте при сохранении качества вывода, почти идентичного плотному вниманию
Короткий диалог / простой вопрос-ответ
Прямой вызов
Повседневные вопросы, резюмирование
Задачи средней сложности
Включить вызов инструментов
Анализ данных, рефакторинг кода
Сложные Agent-задачи
Мышление + вызов инструментов
Многошаговое планирование, анализ кодовой базы, проверка длинных документов
🌟 Открыто, доступно, дружелюбно к экосистеме
⚡ Ускорение вывода на длинном контексте благодаря DSA
💰 Через CherryIN в Cherry Studioбесплатное использование
🖥️ Открытые веса, лицензия MIT, Day-0 поддержка в основных фреймворках вывода, таких как vLLM, SGLang и др.

🧠 Фокус на практических возможностях: код и Agent
DeepSeek V3.2 особенно хорошо показывает себя в реальных рабочих процессах разработки:
Генерация и рефакторинг кода на нескольких языках
Понимание контекста на уровне репозитория и генерация патчей
Agent-инструменты: стабильный вызов внешних инструментов, поиск, выполнение кода
Математика и сложное рассуждение: поддержка задач соревновательного уровня
🧭 Как использовать в Cherry Studio?
Откройте Cherry Studio и перейдите в Настройки → Сервисы моделей.
Найдите CherryIN поставщика услуг и включите его.
В списке моделей выберите DeepSeek V3.2.
Вернитесь в чат и в верхнем выборе модели переключитесь на DeepSeek V3.2 — после этого можно начинать диалог.
💡 Подсказка: бесплатные квоты моделей, предоставляемые CherryIN, оплачиваются официально Cherry Studio и подходят для повседневного знакомства и оценки; для production-среды рекомендуется использовать вместе с официальным API DeepSeek.
📘 Попробуйте DeepSeek V3.2 прямо сейчас и начните путешествие в мир флагманского рассуждения и Agent!
Последнее обновление
Это было полезно?