Claude 4:コーディングと推論に特化した2つの新モデルを発表


AI開発企業のAnthropicは、2つの新しいClaudeモデル「Claude Opus 4」と「Claude Sonnet 4」を発表しました。これらのモデルは、コーディング、高度な推論、AIエージェントの分野で新たな基準を打ち立てるとされています。

モデルごとの特徴

Claude Sonnet 4は、Claude Sonnet 3.7から大幅に進化し、コーディングや推論能力が向上。指示に対する応答精度も高まっています。一方、Claude Opus 4は、複雑で長時間のタスクやエージェントワークフロー向けに設計され、持続的な高パフォーマンスを提供します。

コーディング性能のトップクラス

Claude Opus 4は、Anthropicの最強モデルとして、SWE-benchで72.5%、Terminal-benchで43.2%のスコアを記録し、世界最高のコーディングモデルに認定されています。数千ステップにわたるタスクでも、数時間安定して動作可能です。

Claude Sonnet 4は、パフォーマンスと効率のバランスを重視。Opus 4には及ばないものの、実用性と能力の最適な組み合わせを提供します。

新機能と進化

両モデルには「拡張思考」ベータ機能が搭載され、ウェブ検索やツールを活用しながら推論を進められます。ツールの並行使用やローカルファイルへのアクセス時のメモリ性能も向上。重要な情報を保存し、連続性を保ちながら知識を蓄積できます。

また、ショートカットや抜け穴を使ったタスク処理を抑制し、長い思考プロセスを要約する機能も追加され、より効率的な作業が可能になりました。

Claude Codeの一般提供

エージェント型コーディングツール「Claude Code」がテスト期間を経て一般公開されました。ターミナルでの動作をサポートし、GitHub Actionsによるバックグラウンドタスクや、VS Code、JetBrainsとの統合を提供。ファイル編集、バグ修正、コード関連の質問への回答が可能です。

利用可能性

Pro、Max、Team、Enterpriseプランのユーザーは本日よりClaude Opus 4とClaude Sonnet 4を利用可能。無料ユーザーはSonnet 4にアクセスできます。これらのモデルはAnthropic API、Amazon Bedrock、Google Cloud Vertex AIを通じて開発者向けに提供されています。

 Source: Macrumors