最新ニュース
あなたへのおすすめ
週刊
トップの座を維持する

最高の仮想通貨情報をあなたの受信トレイに直接お届けします。.

OpenAI の GPT-4o は何ができるのか?

によるイビアム・ワヤスイビアム・ワヤス
読了時間2分
OpenAI の GPT-4o は何ができるのか?

OpenAI の GPT-4o は何ができるのか?

  • OpenAI の最新モデル ChatGPT-4o は、「映画に出てくる AI のような感じ」です。
  • テキスト、音声、画像リクエストの任意の組み合わせでリクエストを受け入れ、返すことができます。.
  • 一般的な AI モデルよりも共感的な声で応答します。.

OpenAIは月曜日、 最新の主力モデル であるGPT-4o(「o」は「omni」の略)を発表した。これは、映画『アイアンマン』に登場する「ジャービス」のようなインテリジェントアシスタントに最も近いものと言えるだろう。 

ChatGPT-4oのセールスポイントは、既存のAIモデルのほとんどが対応できない様々なモダリティに対応できることです。つまり、GPT-4oはテキスト、音声、画像のリクエストをあらゆる組み合わせで受け入れ、生成できるということです。.

チームがX(旧Twitter)で発表したステージデモは非常に印象的で、多くの人が熱狂しました。GPT-4oの大きな特徴の一つは、音声入力にわずか232ミリ秒で応答することです。これは、人間の会話中の反応時間とほぼ同じです。.

「まるで映画に出てくるAIのようですが、これが現実のものとなると、いまだに少し驚きます」と、OpenAIのCEOサム・アルトマン氏は月曜日のブログ投稿に記した。「人間レベルの応答時間と表現力を実現できたのは、大きな変化でした。」

OpenAIはGPT-4oのテキストおよび画像機能のユーザーへの展開を開始しました。同社によると、今後数週間以内に、音声および動画機能は「APIを利用する信頼できる少数のパートナー」に公開される予定です。. 

それにもかかわらず、ChatGPT-4o モデルで実行できることのいくつかを次に示します。. 

GPT-4oでできること

読みやすいテキストを含む画像を作成する

これまで、Midjourneyのような一部のAI画像生成ツールは、読みやすいテキストを含む画像の作成に苦労していました。OpenAIによると、GPT-4oはテキスト記述の理解度が大幅に向上し、画像上に読みやすいテキストを作成できるようになりました。. 

画像ソース: OpenAI

リアルタイム翻訳

翻訳機が必要な状況では、GPT-4o が翻訳機として機能します。OpenAI のチームはビデオデモで、GPT-4o が英語で話された内容をスペイン語、あるいは他の言語で繰り返し、さらにスペイン語から英語に戻すことができることを示しました。.

見て伝える

視覚障害のある方、あるいは単に楽しみたい方のために、ChatGPT-4oは携帯電話のカメラを通して周囲の状況を認識し、伝えることができます。あるケースでは、部屋に cake とキャンドルがあることに気づき、誰かが誕生日を祝っていると認識することができました。.

数学の問題を解く

GPT-4oは、紙やディスプレイ画面上の数学の問題を見て、答えを出すこともできます。それだけでなく、問題の解き方を学習するための指導やガイドも提供します。.

ビジュアル会議におけるAI

GPT-4oは、視覚的な会議に参加したり、参加者と会話を交わしたりできます。また、就職面接の準備にも役立ちます。. 

仮想通貨ニュースを読むだけでなく、理解を深めましょう。ニュースレターにご登録ください。 無料です

この記事を共有する

免責事項。 提供される情報は取引アドバイスではありません。Cryptopolitan.com Cryptopolitan、 このページで提供される情報に基づいて行われた投資について一切の責任を負いません。tronお勧めしますdent 調査や資格のある専門家への相談を

イビアム・ワヤス

イビアム・ワヤス

イビアム・ワヤスは2019年から仮想通貨関連ニュースを取材している。ナイジェリア国立オープン大学でコンピュータサイエンスを専攻。彼の記事はCoinfomania、Crypto News Australia、AltcoinBuzzなど、様々な仮想通貨ニュースプラットフォームに掲載されている。コンピュータサイエンスのバックグラウンドを活かし、現在は仮想通貨、ロボット工学、長寿に関するニュースに注力している。.

この記事を共有する
もっと…ニュース
ディープ クリプト
速習コース