苹果公司昨日在 WWDC 2025 大会上宣布,将对其人工智能模型进行更新,并将其应用于整个智能套件。该模型在基准测试中的表现逊于 OpenAI 等竞争对手的旧模型。然而,这家科技巨头表示,其设备端和 Apple Server 版本相比前代产品均已得到改进,并且能够理解超过 15 种语言。.
根据人工测试人员的反馈,最新款可在 iPhone 和其他设备上本地运行的设备端模型在文本生成方面与谷歌和阿里巴巴的旧款模型表现相近。人工测试人员对苹果服务器(Apple Server,专为在苹果数据中心运行而设计)的评价低于 OpenAI 一年前发布的 GPT-4o。在另一项评估中,他们更看好 Meta 的 Llama 4 在图像分析能力方面胜过苹果服务器。这些评价令苹果感到意外,因为Llama 4 Scout 与谷歌、Anthropic 和 OpenAI 等人工智能实验室相比表现不佳。
开发者对苹果的创新承诺持怀疑态度。
开发者们对今年的WWDC发布会持负面态度,包括苹果公司规模较小的设备端AI模型。人工智能个人理财应用Origi的首席产品官Atul Kakkar透露,作为一名开发者,他并没有感受到蒂姆·库克领导的苹果公司发布产品时那种激动人心的氛围。他认为,一年一度的WWDC曾经是科技界最热门的盛会,但如今却笼罩着一层质疑的阴影,人们怀疑这家iPhone制造商能否跟上人工智能巨头的步伐。
苹果公司不公布其人工智能的基准测试数据,而是发布一份缺乏充分记录的对比评测报告。
但即便以它们的标准来看,苹果最新的设备端模型也大多不如谷歌的开源Gemma 3-4B或Qwen 3-4B。
他们的服务器 LLM 和 Llama 4 Scout 很像。pic.twitter.com/hwpOG5Lgyp
— 伊森·莫里克 (@emollick) 2025 年 6 月 10 日
这家科技巨头面临着持续更新其面向开发者的AI工具并在Apple Intelligence套件中打造令人兴奋的消费者体验的压力。人工智能育儿建议应用Bobo的首席执行官兼联合创始人格兰特·麦克唐纳表示,蒂姆·库克的公司正在做一些有趣的事情,但这还不足以使其在众多竞争者中脱颖而出。.
麦克唐纳认为,让开发者使用其设备端小型AI模型构建AI驱动的应用程序,正是公司希望实现的价值所在。小型AI模型使用小型数据集进行训练,计算能力要求更低,这意味着它们可以在iPhone上运行,而无需在云端的大型服务器上运行。他表示,在设备上运行模型实际上比基于云的模型(例如GPT和Gemini)更便宜。.
开发者们一直质疑设备端模型能否媲美云端模型。一位开发者表示,他们无法利用专有数据集对设备端模型进行微调。麦克唐纳表示,设备端模型或许足以满足某些应用的需求,但对于育儿应用Bobo来说则远远不够。Bobo利用睡眠顾问、哺乳顾问、语言病理学家和其他育儿专家的专有数据,定制了其人工智能模型。.
苹果的人工智能研究部门难以赶上竞争对手
这家科技巨头承诺对Siri进行升级,使其提供更多个性化内容,但此次升级已被推迟。一些客户已就该公司推销尚未交付的产品提起诉讼。研究人员表示,虽然人工智能模型在数学和科学领域表现出色,但在处理复杂问题时,它们只能产生一种“思考”的假象。.
这家科技巨头为了避免卷入争论,推迟了大型语言模型的开发和人工智能在其设备中的应用。在WWDC大会,该公司发布了Apple Intelligence的人工智能功能,但社区普遍认为其表现平平。
研究人员发现,逻辑推理模型(LRM)在达到一定程度后开始失效。研究表明,所有推理模型都呈现出类似的模式:随着问题复杂度的增加,准确率逐渐下降,直至降至零。研究人员指出,推理模型最初会投入更多的思考资源,但随着复杂度的增加,它们会放弃思考,而且与直觉相反,尽管问题难度不断增加,它们的推理投入反而开始减少。
据 Forrester 研究分析师 Dipanjan Chatterjee 称,围绕 Siri 的沉默令人震惊。他表示,再多的文本纠错功能或可爱的表情符号也无法满足人们对 Siri 所具备的交互式 AI 体验的期待。他认为,如果微软不尽快采取行动,Siri 的末日将至。微软并未给出 Siri 升级的具体时间表。不过,据该公司一位高级软件主管 Craig Federighi 透露,最早也要到明年才会进行升级。.

