スイス連邦工科大学チューリッヒ校の研究者たちは、画期的な成果として、人気ゲーム「ラビリンス」で人間を上回る成績を収めたAIロボット「サイバーランナー」を開発しました。このロボットは、微細運動能力と空間認識能力を駆使して小さな金属球を操作し、迷路を6時間でクリアするという偉業を成し遂げました。
これは、人工知能が直接的な物理的応用において優れた成果を挙げた最初の例の 1 つであり、器用さを必要とするタスクにおいて思考し、学習し、自己発達する能力を示しています。
モデルベース強化学習:成功への鍵
研究者のラファエロ・ダンドレア氏とトーマス・ビ氏は、モデルベース強化学習と呼ばれる分野における最近の進歩を活用し、サイバーランナーにラビリンスゲームで優位に立つ方法を教えました。このタイプの機械学習では、AIが試行錯誤を通じて動的な環境における行動を学習します。
研究者たちは、自分たちの研究成果を学術論文で共有することで、他の人々が自分たちの研究結果に基づいて研究を進めることを可能にしており、プロジェクトの共同作業とオープンソースの性質を強調している。
このプロジェクトの注目すべき点の一つは、そのアクセスしやすさです。ダンドレア氏とビ氏は、その成果をオープンソースプラットフォーム上で公開することで、より幅広いコミュニティがAIロボティクスの探求、実験、そして革新を行えるようにしています。
わずか 200 ドルの価格で、ユーザーは CyberRunner プラットフォームを利用して大規模な実験を行い、AI 愛好家や研究者の間でコミュニケーションを促進し、ベスト プラクティスを共有できます。
AIの反復型から適応型への進化
産業用ロボットは長年、反復的で精密な製造作業を得意としてきました。しかし、CyberRunnerが示した柔軟性と適応性は、AI駆動型マシンの能力における飛躍的な進歩を表しています。
このロボットがリアルタイムで考え、学習し、動的な物理的タスクに適応する能力は、これまでは人間の知能によってのみ実現可能だと考えられていました。
経験を通して学ぶ:サイバーランナー独自のアプローチ
CyberRunnerの学習プロセスは、その成功の興味深い側面です。迷路を上空から観察するカメラを搭載したこのロボットは、経験を通して学習し、近道など、迷路を進む意外な方法を発見します。
しかし、研究者らは介入して、こうした近道を悪用しないよう指示する必要があり、 AI開発における倫理的配慮の必要性が浮き彫りになった。
ダンドレア氏は、このプロジェクトは高価な特注プラットフォームではなく、AIロボティクスの発展に関心を持つすべての人にとって、オープンで手頃な価格のリソースであると強調しました。この包括性と手頃な価格こそが、この分野の急速な進歩の可能性を秘めている重要な要素です。

