Google、最も知能的なモデル Gemini 2.5 Proをリリース


Googleは、推論能力が向上し、より高いパフォーマンスと精度を持つ「最も知能的なモデル」であるGemini 2.5をリリースしました。このモデルは、Gemini 2.0リリースからわずか数ヶ月後、そしてDeepSeekの台頭の中での発表となりました。

Gemini 2.5 Proの特徴

より強力な基盤モデルとポストトレーニング

Google DeepMindのCTOであるKoray Kavukcuoglu氏は、Gemini 2.5が「AIをよりスマートに、そして推論能力を高める」というGoogleの目標における次のステップを表していると述べています。

「Gemini 2.5では、大幅に強化された基盤モデルと改良されたポストトレーニングを組み合わせることで、新しいレベルのパフォーマンスを達成しました」とKavukcuoglu氏は説明しています。「今後は、これらの思考能力をすべてのモデルに直接組み込み、より複雑な問題に対処し、さらに有能でコンテキストを認識するエージェントをサポートできるようにしていきます。」

より広いコンテキストと理解力

Gemini 2.0やGemini 2.0 Flash Thinkingと同様に、Gemini 2.5 Proは応答する前に「考える」能力を持っています。新モデルはテキスト、音声、画像、動画、大規模データセットからのマルチモーダル入力を処理できます。さらに、コーディングプロジェクトのためのコードリポジトリ全体を理解する能力も備えています。

Gemini 2.5 Proは、Gemini上の実験モデルとして利用可能な最大のコンテキストウィンドウを提供しています。初期は100万トークンのコンテキストウィンドウを搭載していますが、近日中に200万トークンに拡張される予定です。Google AI Studioのプロダクトマネージャー、Logan Kilpatrick氏はXで、Gemini 2.5 Proが「より高いレート制限と課金機能を持つ最初の実験モデル」であると投稿しています。

Googleは近日中にGemini 2.5モデルの価格を発表する予定です。

強化されたコーディングと推論パフォーマンス

Googleによると、このモデルは高度な推論ベンチマークテストでリードしているとのこと。同社は、Gemini 2.5 Proが「GPQAやAIME 2025などの数学や科学のベンチマークでリードしている」と述べています。Kavukcuoglu氏によれば、このモデルは「ツールを使用しないモデル間で、人間の知識と推論を捉えることを目的としたデータセットである『Humanity’s Last Exam』で最先端の18.8%のスコアを記録した」とのことです。

Gemini 2.5 Proはコーディングタスクでも優れたパフォーマンスを発揮し、特定のベンチマークではGemini 2.0よりも良いスコアを獲得しています。Googleは、新モデルが「視覚的に魅力的なウェブアプリやエージェンティックなコードアプリケーションの作成、コードの変換や編集において優れている」と述べています。

より競争が激しい市場

Gemini 2.5 Proは、Gemini 2.0が12月に登場した時と比べて大きく変化した環境で推論モデル市場に参入します。DeepSeekの推論大規模言語モデル(LLM)DeepSeek-R1のリリースにより、強力なモデルがトレーニングと計算コストのわずかな部分で優れたパフォーマンスを発揮できることが示されました。さらに、DeepSeekはオープンソースモデルがOpenAIのo1やo3モデルなどのよりクローズドソースなLLMと競合できることを証明しました。

DeepSeekの拡大し続けるモデル提供に加えて、GoogleはOpenAIの推論モデルとも競争しなければなりません。OpenAIの最新モデルはGPT-4.5(推論モデルではない)でしたが、同社は近い将来さらに多くの推論モデルを開発すると予想されています。

Gemini 2.5はGoogleが今月リリースする2番目の新モデルです。3月には、128,000トークンのコンテキストモデルを提供し、オンザゴーデバイスでの使用に最適な小型言語モデル、Gemma 3の最新バージョンをリリースしました。

Source: VentureBeat