Googleの主力AIモデル、Gemini 2.5 Proが、1996年のゲームボーイの classic 『ポケットモンスター 青』をクリアしました。.
昨夜、Googleの最高経営責任者サンダー・ピチャイ氏はXに関するニュースを共有し、「素晴らしい完成度!Gemini 2.5 Proがポケモン ブルーをクリアしました!」と書き込んだ。
素晴らしいフィニッシュ!Gemini 2.5 Proがポケモン ブルーをクリアしました!ライブストリームの作成と運営をしてくださった@TheCodeOfJoel /E2pn3tpfEb
— サンダー・ピチャイ (@sundarpichai) 2025 年 5 月 3 日
TechCrunchは、「Googleとは無関係」と主張する30歳のソフトウェアエンジニア、ジョエル・Z氏がTwitchでレースを配信した報じた
それでも、Googleの幹部たちはこのプロジェクトを応援している。Google AI Studioのプロダクトリードであるローガン・キルパトリック氏は先月、 述べ、「5つ目のバッジを獲得した(次に優れたモデルは、異なるエージェントハーネスを使用しているものの、まだ3つしか獲得していない)」と投稿した。ピチャイ氏はこれに対し、「私たちはAPI、つまり人工知能ポケモンの開発に取り組んでいます :)」と冗談交じりに返した
ジェミニはポケモン赤でまだ開発中の人型AIモデルクロードに勝利した。
ゲームの選択は偶然dent。2月、ライバル企業のアントロピックは、自社のクロードモデルが「ポケモン 赤」をプレイ中に着実に進歩を遂げていることをアピールしました。同社は、クロードの「拡張思考とエージェントトレーニング」が、classicロールプレイングゲームのような予想外のタスクにおいて「大きな進歩」をもたらしたと述べています。
ジョエル Z 氏は、Claude Plays Pokémon の Twitch フィードがインスピレーションの源の 1 つであると述べています。.
今のところ、クロードはまだ「ポケットモンスター 赤」をクリアしていません。つまり、ジェミニの方がゲームが上手いということです。.
しかし、ジョエル・Zは視聴者に対し、この比較を過度に解釈しないよう警告した。「法学修士(LLM)がポケモンをどれだけ上手にプレイできるかのベンチマークとして捉えないでください」と彼はTwitchのページに記した。「ジェミニとクロードはツールも受け取り方も異なるので、単純に比較することはできません」
GoogleのGeminiは、他のAIモデルと同様に、プロンプトやいわゆるエージェントハーネスの助けを必要とする。
エージェントハーネスは、画面上の追加データを含む更新されたスクリーンショットをLLMと共有します。その後、Geminiは状況を判断し、特殊なタスクを実行するサブエージェントを呼び出し、最終的にゲームボーイエミュレータでどのボタンを押すかを指示します。

ジョエル・Zは、自分が時々介入することを認めつつも、その介入は妥当な範囲内だと主張した。「私の介入は、ジェミニの全体的な意思決定能力と推論能力を向上させます」と彼は説明した。さらに、このモデルは、マウント・ムーンのような特定の課題において、具体的なヒントやウォークスルー、直接的な指示を必要としない。.
彼はさらに、「これに近いのは、ジェミニが、これは後にポケモン イエローで修正されたバグでした」と付け加えた。
「Gemini Plays Pokémonは現在も積極的に開発中です」とジョエル氏は語り、プロジェクトの背後にあるフレームワークは「進化し続けています」と指摘した。

