DeepSeek V3.2

Cherry Studio ユーザーは現在、内蔵の CherryIN サービスを無料で体験できます DeepSeek V3.2——DeepSeek が 2025 年 12 月 1 日にリリースしたフラッグシップ級の疎な注意力 MoE モデルで、初めて「思考」をツール呼び出しにネイティブ統合し、上級 Agent や長文脈シナリオに最適な選択肢です。


🚀 DeepSeek V3.2 とは?

DeepSeek V3.2 は V3.2-Exp をベースに進化し、Mixture-of-Experts(MoE)アーキテクチャを採用し、さらに DeepSeek Sparse Attention(DSA) の疎な注意力メカニズムを導入することで、超大規模な総パラメータを維持しつつ、長文脈推論コストを大幅に削減しています。

  • アーキテクチャ:MoE + DeepSeek Sparse Attention(DSA)+ Multi-Head Latent Attention(MLA)

  • 総パラメータ数:685B

  • トークン当たりの有効化パラメータ数:約 37B

  • エキスパート数:各層 256 個のエキスパート

  • オープンソースライセンス:MIT

  • リリース日:2025 年 12 月 1 日(V3.2-Exp は 2025 年 9 月 29 日にリリース)

V3.2 では API 向けの DeepSeek-V3.2-Speciale 版も同時にリリースされ、複雑な推論タスクで IMO、CMO、ICPC World Finals、IOI 2025 の金メダル級の成果を収めました。


📚 堅実な学習とアライメントのプロセスを継承

DeepSeek V3.2 は V3 系列の成熟した学習パイプラインを踏襲し、Agent シナリオ向けに重要な拡張を行っています:

  1. 大規模事前学習:膨大で高品質な多言語コーパス上で基礎学習を完了し、コード、数学、科学知識を網羅。

  2. 疎な注意力の導入:128K シーケンス長でメインモデルと lightning indexer を学習し、各クエリトークンは 2048 個のキー・バリュートークンを注意計算に参加させます。

  3. 大規模 Agent データ合成:1,800 以上の環境と 85,000 以上の複雑な指示をカバーする、新しい Agent 学習データ合成手法。

  4. 思考とツール呼び出しの融合:V3.2 は DeepSeek 初の「思考」をツール使用にネイティブ統合したモデルで、「思考モード」と「非思考モード」の両方でツール呼び出しをサポートします。


⚙️ フラッグシップ級のコア能力

DeepSeek V3.2 は「GPT-5 と同等レベル」の総合能力を打ち出し、Agent と複雑推論を大幅に強化しています:

  • ネイティブ思考 + ツール呼び出し:thinking を tool-use に統合した初の DeepSeek モデル

  • トップクラスの推論能力:V3.2-Speciale は IMO / CMO / ICPC World Finals / IOI 2025 で金メダル水準に到達

  • コードと開発タスク:V3 系列の強力なコード能力を継承

  • 長文脈の安定性:DSA による長文ドキュメントやコードベース規模の分析能力

  • 構造化ツール呼び出し:多段階の計画と実行を行う Agent の構築に適しています


💡 DeepSeek Sparse Attention:より長く、より省エネ

DSA は V3.2 の中核技術アップグレードであり、 lightning indexer + 細粒度トークン選択 によって次を実現します:

  • 大規模モデルで初めて細粒度の疎な注意力を実現

  • コア注意力の計算複雑度を O(L²) から削減

  • 長文脈の学習と推論を大幅に高速化しつつ、密な注意力とほぼ同等の出力品質を維持

シナリオ
推奨される使い方

短い対話 / 簡単な Q&A

直接呼び出し

日常的な Q&A、要約

中程度の複雑さのタスク

ツール呼び出しを有効化

データ分析、コードリファクタリング

複雑な Agent タスク

思考 + ツール呼び出し

多段階計画、コードベース分析、長文書レビュー


🌟 オープン、利用可能、エコシステムに優しい

  • ⚡ DSA による長文脈推論の高速化

  • 💰 CherryIN を通じて Cherry Studio で無料で利用

  • 🖥️ オープンソースの重み、MIT ライセンス、vLLM、SGLang など主要推論フレームワークが Day-0 対応


🧠 実用能力に注力:コードと Agent

DeepSeek V3.2 は実際の開発ワークフローで特に優れた性能を発揮します:

  • 多言語コード生成とリファクタリング

  • コードリポジトリ規模の文脈理解とパッチ生成

  • Agent ツールチェーン:外部ツール、検索、コード実行を安定して呼び出し

  • 数学と複雑推論:競技レベルの問題に対応


🧭 Cherry Studio での使い方は?

  1. Cherry Studio を開き、 設定 → モデルサービスに進みます。

  2. を見つけて CherryIN サービスプロバイダーを有効にします。

  3. モデル一覧で DeepSeek V3.2に進みます。

  4. チャット画面に戻り、上部のモデル選択で DeepSeek V3.2 に切り替えると、会話を開始できます。

💡 ヒント:CherryIN が提供する無料モデル枠は Cherry Studio 公式が負担しており、日常の体験や評価に適しています。運用環境では DeepSeek 公式 API の併用を推奨します。


📘 今すぐ DeepSeek V3.2 を体験し、フラッグシップ級の推論と Agent の旅を始めましょう!

最終更新

役に立ちましたか?