After DeepSeek launched its new AI model, Google stole the show by announcing Gemini 2.5 on March 25. Google calls it their “smartest model” yet. They said this is an “experimental version of Gemini 2.5 Pro.” It leads in various benchmarks and took first place on LMArena by a large margin at launch.”
Gemini 2.5 is part of Google’s Gemini AI family. It enhances reasoning skills and builds on Gemini 2.0 Flash Thinking, which was introduced in December 2024. The Gemini 2.5 Pro outperformed OpenAI’s o3-mini and Anthropic’s Claude 3.7 Sonnet on Humanity’s Last Exam (HLE). This new test aims to fix “benchmark saturation.” That happens when AI models advance so quickly that current tests become too easy. Achieving an 18.8% score on HLE, Gemini 2.5 outperformed o3-mini’s 14% (which assesses only text-based inputs) and Claude 3.7 Sonnet’s 8.9%.
Gemini 2.5は、現在チャットボットアリーナランキングのトップにいます。科学、数学、コーディングのテストで素晴らしい結果を示しています。他のモデルを僅差ではありますが、明確に上回っています。AIの進歩の速さを考えれば、これは驚くべきことではありません。グーグルによると、新しいGemini 2.5 Proは、推論、マルチモーダル処理、エージェントベースのインタラクションにおいて大きな進歩を示しています。ユーザーの入力が少なくてもうまく機能します。
こちらもお読みください: セールスフォース、Tableau PulseとTableau Agentの日本語サポートを開始
Gemini 2.5 Proは、100万トークンのコンテキストウィンドウを提供するようになりました。3月25日現在、Google AI StudioおよびGeminiアプリを通じてGemini Advancedユーザーに提供されています。まもなくVertex AIでも利用可能になります。 グーグル はまた、今後数週間のうちに価格の詳細を発表する予定であることも示唆しています。
