アップルのアップグレードされたAIモデルは競合他社に比べてパフォーマンスが低い

読了時間3分 2025年6月11日

Apple は昨日、iOS、macOS、iPadOS 全体の Apple Intelligence スイートの機能を強化する AI モデルのアップデートを発表しました。.
このモデルは、OpenAIを含むライバル企業の古いモデルと比較して、Appleのベンチマークではパフォーマンスが低かった。.
このテクノロジー大手は、オンデバイスとアップルサーバーが改良され、15以上の言語を理解できると主張した。.

Appleは昨日、WWDC 2025において、AIモデルの今後のアップデートを発表した。このアップデートは、同社のインテリジェンススイート全体に搭載される予定だ。このモデルは、OpenAIなどの競合企業の旧モデルと比較すると、ベンチマークテストでパフォーマンスが低かった。しかし、Appleは、オンデバイスとApple Serverは以前のモデルに比べて改善されており、15以上の言語を理解できると主張した。.

人間のテスターによると、iPhoneなどのデバイス上でローカルに動作する最新のオンデバイスモデルは、テキスト生成に関してGoogleやAlibabaの旧モデルと同等の性能を示した。Appleのデータセンターで動作するように設計されたApple Serverは、OpenAIの1年前のGPT-4oよりも劣ると人間のテスターによって評価された。別の評価では、画像分析能力においてMetaのLlama 4がApple Serverよりも優れていると評価された。Llama 4 ScoutはGoogle、Anthropic、OpenAIなどのAIラボと比較して性能が劣っていた

開発者はアップルのイノベーションの約束に懐疑的だ

開発者たちは否定的な見方をしている。AI搭載の個人向け金融アプリ「Origi」の最高製品責任者であるアトゥル・カッカー氏は、開発者として、ティム・クック氏率いるアップルが発表した内容に、かつてのような熱狂を感じなかったと明かした。同氏は、毎年開催されるWWDCはかつてテクノロジー業界で最も話題を呼ぶイベントだったが、今ではiPhoneメーカーがAI大手企業に追いつけるのかという懐疑的な見方が広がっていると考えている。

Appleは自社AIのベンチマークを公表しておらず、不十分な文書化された直接比較評価に基づいて報告している。

しかし、Appleの最新デバイスモデルは、Googleのオープン型Gemma 3-4BやQwen 3-4Bと比べても、Appleの基準から見てもほとんどが劣っている。

そして彼らのサーバーLLMはLlama 4 Scoutに似ています pic.twitter.com/hwpOG5Lgyp

— イーサン・モリック (@emollick) 2025 年 6 月 10 日

このテクノロジー界の巨人は、開発者向けAIツールを継続的にアップデートし、Apple Intelligenceスイート内で魅力的な消費者体験を構築することで、時代の変化に対応していくプレッシャーにさらされている。AI搭載の子育てアドバイスアプリ「Bobo」のCEO兼共同創業者であるグラント・マクドナルド氏は、ティム・クック氏のAppleは興味深い取り組みを行っているものの、既存の雑音を突破するには十分ではないと述べた。.

マクドナルド氏は、開発者がオンデバイス型の小型AIモデルを使ってAI搭載アプリケーションを構築できるようにすることが、同社が提供したい価値であると考えている。小型AIモデルは小規模なデータセットで学習するため、計算能力の消費量が少なく、クラウド上の大規模サーバーではなくiPhone上で実行できる。マクドナルド氏によると、デバイス上でモデルを実行することは、GPTやGeminiといったクラウドベースのモデルよりも実質的に安価である。.

開発者たちは、オンデバイスモデルがクラウドベースのモデルに比べて優れたパフォーマンスを発揮できるかどうか疑問視している。ある開発者は、独自のデータセットでは微調整が不可能だと述べた。マクドナルド氏は、オンデバイスモデルは一部のアプリには十分だが、Boboには適さないと述べた。この子育てアプリは、睡眠コンサルタント、授乳コンサルタント、言語聴覚士、その他の子育て専門家から得た独自のデータを用いてAIモデルをカスタマイズしている。.

アップルのAI研究部門は競合他社に追いつくのに苦戦している

テクノロジー大手の同社は、よりパーソナライズされたコンテンツを提供するSiriのアップグレードを約束していましたが、このアップグレードは延期されています。一部の顧客は、未だ出荷されていない製品のマーケティングを行ったとして同社を訴えています。研究者によると、AIモデルは数学や科学分野では非常に優れたパフォーマンスを発揮しますが、複雑な問題では思考しているという錯覚しか生み出さないとのことです。.

このテクノロジー大手は、議論の渦中に巻き込まれないよう、大規模な言語モデルの開発と自社デバイスへのAI実装を遅らせた。WWDCでは、AI機能のための「Apple Intelligence」を発表したが、コミュニティからは期待外れとの評価を受けた。

研究者たちは解明しました。これは、すべての推論モデルが同様のパターンを示し、問題の複雑さが増すにつれて精度が徐々に低下し、最終的に精度がゼロになることを示しています。研究者によると、推論モデルは当初はより多くの思考トークンを適用しますが、複雑さが増すにつれて思考トークンの使用を諦め、直感に反して、問題の難易度が上昇しているにもかかわらず、推論の労力が減少し始めるのです。

フォレスター・リサーチのアナリスト、ディパンジャン・チャタジー氏によると、Siriを取り巻く沈黙は耳をつんざくほどだったという。彼は、どんなにテキスト修正や可愛い絵文字を追加しても、Siriが実現できると確信している対話型AI体験を満たすことはできないと明かした。同社が迅速に行動しなければ、Siriの終焉は近いと彼は考えている。同社はSiriのアップグレードの正確なスケジュールを明らかにしていない。しかし、同社のソフトウェア担当幹部であるクレイグ・フェデリギ氏によると、早くても来年までは実現しないとのことだ。.

最も賢い暗号通貨マインドを持つ人々はすでに私たちのニュースレターを読んでいます。参加してみませんか？ぜひご参加ください。

アップル OpenAI Siri

この記事を共有する

コリンズ・J・オコス

コリンズ・オコスは、仮想通貨とテクノロジー分野を8年間取材してきたジャーナリスト兼市場アナリストです。彼は公認財務アナリスト（CFA）の資格を持ち、アクチュアリーmaticの学位も取得しています。コリンズは以前、Geek ComputerとCoinRabbitでライター兼編集者として勤務していました。.

1. 開発者はアップルのイノベーションの約束に懐疑的だ

2. アップルのAI研究部門は競合他社に追いつくのに苦戦している

この記事を共有する