Googleは現在、Gemini AIを多くの製品に搭載し始めており、その計画の次のステップはフォトです。昨日開催されたGoogle I/O開発者会議で、CEOのサンダー・ピチャイ氏は「Ask Photos」という機能を発表しました。これは、Geminiに話しかけることで、ギャラリー内の特定の画像を見つけるのに役立つ機能です。
ジェミニAI写真検索
リクエストされる写真は、Googleフォトアプリの下部にある新しいタブに表示されます。当初は1人の登録者のみ利用可能で、英語での提供となり、今後数か月かけて米国で提供される予定です。パネルをタップすると、ふたご座の星のアイコンと、「写真について検索または質問してください」というバーの上にウェルカムメッセージが表示されます。
Googleは、「これまで訪れた国立公園のベストショットを見せて」といった質問をすることができると主張している。これはユーザーのGPS情報に依存し、AIが「ベスト」を判断する必要がある。同社のCEO、フォト部門のシムリット・ベン=ヤイル氏はEngadgetに対し、ユーザーはAIにフィードバックを与え、どの写真が一番気に入ったかをAIに知らせることができると語った。ベン=ヤイル氏は、この学習が極めて重要だと述べた。.
段階的な展開を計画
フォト機能は、最近の休暇で撮ったお気に入りの写真を探し出し、キャプションを付けてソーシャルメディアに簡単に投稿するのに役立ちます。繰り返しになりますが、もしふたご座で選んだ写真が気に入らなかった場合は、後から調整することも可能です。.
これまでは、Ask Photos でクエリを入力する必要があり、音声入力はまだサポートされていませんでした。この機能がようやく利用可能になると、この機能を利用するユーザーは、現在の検索機能が「改善」され、Ask に生まれ変わります。ただし、Google はフェイスグループやマップビューといった基本的な検索機能がなくなることはないと述べています。.
同社は、「Ask Photos」のプロセスについて、3つの要素、すなわち「お客様の質問を把握する」「回答を組み立てる」「慎重に行動する」「修正を忘れない」という3つの要素について説明しました。これらはすべて同じ意味です。安全性についてはプロジェクトの最終段階でのみ議論されますが、プロセス全体を通して考慮する必要があります。同社は、「お客様の写真に含まれる情報は非常にプライベートなものであり、当社はそれを非常に真剣に受け止め、保護する準備ができています」と述べています。
その結果、クエリはクラウド(デバイス上ではなく)で処理された場合でも、どこにも保存されません。不正使用や危害に対処する必要があるまれなケースを除き、人間以外の第三者が「Ask Photos」内の会話や個人データを閲覧することはありません。Googleは、他のGeminiモデルや製品を含む、Googleフォト以外の生成AI製品をこの個人データでトレーニングすることはないとしています。.
データプライバシーの保証
メディアはGoogleフォトと同じセキュリティとプライバシー対策によって安全かつプライベートに保たれます。Ask Photosを使えば、何年も前に撮った写真からパスポートや免許証の有効期限などの情報を取得できるため、まさに理想的な使い方と言えるでしょう。また、このアプリはGeminiのマルチモーダル機能を利用して画像内のテキストを読み上げ、回答を見つけることもできます。.
GoogleフォトのAIは、確かに目新しいものではありませんでした。同社の顔認識および物体認識アルゴリズムを使用することで、これまでもアプリ内で「クレジットカード」や特定の友人などを探すことは可能でした。フォトでは特定の人物やアイテムが写っている画像しか提供できないように思われるかもしれませんが、 Gemini AIは生成処理を導入しています。つまり、フォトではさらに多くのことができるようになるのです。
他のアプリとは別に、Photosには、パートナーやお子様のために最近開いた誕生日パーティーでどのようなテーマを使ったかを知るための機能もあります。Gemini AI、写真を閲覧し、すでに採用したテーマを分析してくれます。
Ask Photosは、現在試験的な機能としてまもなく展開が開始されており、多くの成功事例が存在します。他の写真ツールと同様に、まずはOneの加入者とPixelユーザー向けのプレミアム機能として提供され、その後、無料アプリをご利用のすべてのユーザーに段階的に提供される可能性があります。現時点では、それがいつ、あるいは本当に実現するかどうかについて、公式に発表されている情報はありません。.

