DeepSeek V3-0324、推論なしAIモデルでオープンソース初のトップスコアを獲得


DeepSeek V3-0324がオープンソースAIの歴史的成果を達成

DeepSeek V3-0324が、Artificial Analysis Intelligence Indexにおいて推論なしモデルとしては最高得点を記録し、オープンソースAIの歴史的な成果を達成しました。この新モデルはベンチマークで7ポイント向上し、GoogleのGemini 2.0 Pro、AnthropicのClaude 3.7 Sonnet、MetaのLlama 3.3 70Bなどの独自モデルを上回りました。

V3-0324は、DeepSeek自身のR1やOpenAI、Alibabaが提供する推論モデルには及ばないものの、この成果は即時応答が重要な低レイテンシーアプリケーションにおいて、オープンソースソリューションの実用性が高まっていることを示しています。

オープンソースAIの新時代を切り拓くDeepSeek V3-0324

推論なしモデル(熟考する「思考」段階なしに即座に回答を生成するモデル)は、チャットボット、カスタマーサービスの自動化、リアルタイム翻訳などのユースケースに不可欠です。DeepSeekの最新版は今、これらのアプリケーションにおいて業界標準を確立し、主要な独自ツールをも凌駕しています。

「これはオープンウェイトモデルが初めて推論なしモデルでトップに立った瞬間であり、オープンソースにとってマイルストーンとなる成果です」とArtificial Analysisは述べています。このモデルのパフォーマンスは独自推論モデルに近づいていますが、複雑な問題解決を必要とするタスクでは後者が依然として優位性を保っています。

DeepSeek V3-0324は2024年12月の前モデルから多くの仕様を維持しています:

  • 128kコンテキストウィンドウ(DeepSeekのAPIでは64kに制限)
  • 総計671億パラメータ(FP8精度で700GB以上のGPUメモリが必要)
  • 370億アクティブパラメータ
  • テキストのみの機能(マルチモーダルサポートなし)
  • MITライセンス

「まだ家庭で実行できるものではありません!」とArtificial Analysisは言及し、企業グレードのインフラ要件を強調しています。

競争力を高めるオープンソースAI

DeepSeek R1のような独自推論モデルがIntelligence Indexでの優位性を維持している一方、そのギャップは縮まりつつあります。

3ヶ月前、DeepSeek V3はAnthropicやGoogleの独自モデルとほぼ互角でしたが、それらを超えるには至りませんでした。今日、更新されたV3-0324はオープンソースの代替モデルをリードするだけでなく、すべての独自非推論ライバルをも上回っています。

「このリリースはR1よりも印象的とも言えるでしょう」とArtificial Analysisは評価しています。

DeepSeekの進歩はAI業界のシフトを示しており、オープンソースフレームワークが閉鎖的システムとますます競争するようになっています。開発者や企業にとって、MITライセンスのV3-0324は強力で適応性の高いツールを提供しますが、計算コストがアクセシビリティを制限する可能性があります。

「DeepSeekは現在、推論なしオープンウェイトモデルの最前線を牽引しています」とArtificial Analysisは宣言しています。

R2の登場が近づく中、コミュニティは次なるAIパフォーマンスの飛躍を待ち望んでいます。

Source: AINews