数学性能の超高い「Gemini 2.5 Deep Think」のテストが始まる

2025年08月04日 10時50分ソフトウェア

GoogleのAIサブスクリプションサービスのうち最上位のプラン「Google AI Ultra」の加入者向けに、推論能力を強化した「Gemini 2.5 Deep Think」の提供が始まりました。数学問題を解く性能が高いことが特徴だと紹介されています。

Gemini 2.5: Deep Think is now rolling out

https://blog.google/products/gemini/gemini-2-5-deep-think/

「Gemini 2.5 Deep Think」は、2025年の国際数学オリンピックで金メダル基準を達成したモデルの別バージョンです。

Googleの強化版Geminiが数学オリンピックで金メダルを取る性能に到達、自然言語で動作し人間と同じ制限時間で解答を導き出す - GIGAZINE

上記のモデルは数学に強いものの、複雑な問題の推論に数時間かかります。今回登場したGemini 2.5 Deep Thinkは、国際数学オリンピックで銅メダルを取るレベルまで性能を抑えた代わりに、推論時間を短くして日常使用に最適化したとのことです。なお、金メダルレベルのモデルも正式公開されています。 Gemini 2.5 Deep Thinkは「並列思考技術」と呼ばれる技術を活用しており、同時に多くのアイデアを生成し、それらを並行して検討できます。時間をかけてアイデアを修正したり組み合わせたりした後、最良の答えに到達するとのこと。これにより、詳細で創造的かつ思慮深い応答を提供するとも紹介されています。

今回リリースされたモデルは反復的な開発に優れており、複雑なものを少しずつ構築するタスク、数学的な仮説の策定や探索、複雑な科学文献の分析、コーディング問題などを得意とします。推論・知識、コーディング、数学能力を検証するベンチマークでは、同じく推論能力を持つGemini 2.5 ProやOpenAI o3、Grok 4と比べて高い性能を示しました。

また、Gemini 2.5 Deep ThinkはGemini 2.5 Proに比べて安全性とトーンの客観性が向上しました。一方で無害なリクエストを拒否する傾向がやや高かった点も確認されました。 Google AI Ultraの加入者は、使用モデルとして2.5 Proを選択し、プロンプトバーで「Deep Think」をオンにすることで、Gemini 2.5 Deep Thinkを利用できます。Deep Thinkはコード実行やGoogle検索などのツールと自動的に連携し、より長い応答を生成できます。今後数週間以内に、Gemini API経由で信頼できるテスター向けにツールあり/なしの Deep Thinkをリリースし、開発者やエンタープライズ向けの使いやすさをより深く理解するための取り組みを進めていくとのことです。

GoogleのAI「Gemini」のAndroidアプリとブラウザ版がついに動画のアップロードに対応 - GIGAZINE

GoogleがGemini 2.5 Pro／Flashを一般公開＆安価かつ最速の「Gemini 2.5 Flash-Lite」プレビュー版を新たにリリース - GIGAZINE

ChatGPTとGeminiとDeepSeekとClaudeで5つのテストをして最も優秀だったのはどのモデルなのか？ - GIGAZINE