据报道,苹果公司无视工程师对其 Apple Intelligence 技术缺陷的警告,执意发布了该技术,结果市场反响平平。.
iPhone 制造商苹果公司的 Apple Intelligence 因一些负面原因成为新闻头条,并招致广泛批评,尤其是因为捏造虚假信息和篡改新闻标题。.
工程师在包括苹果智能系统在内的许多型号中发现了缺陷。
大型语言模型出现“幻觉”现象很常见,人工智能行业至今仍未解决这个问题,甚至可能永远无法解决,但苹果的情况略有不同。工程师们在模型发布前就发现了一些严重的缺陷。然而,该公司却忽视了这些警告。.
分析人士认为,这家科技巨头在人工智能存在巨大defi。这些警告来自去年10月发布的研究
虽然这项研究尚未经过同行评审,但它在测试了人工智能行业一些顶级LLM的matic“推理”能力后,也得出结论:这些模型并不具备推理能力。.
GSM8K 数据集的数千个数学问题,该数据集是业界的基准。
根据 Futurism 的说法,数据集中的一个典型问题是:“詹姆斯买了 5 包牛肉,每包 4 磅。牛肉的价格是每磅 5.50 美元。他一共付了多少钱?”
为了避免数据污染,工程师们简单地修改了问题中的一些数字,结果却暴露了人工智能模型的缺陷。这导致所考察的20个LLM模型出现了一些虽小但显著的误差。.
然而,当研究人员进一步更改姓名并添加一些“无关细节”时,结果却是“灾难性的”,准确率高达 65%。.
研究人员写道:“这揭示了这些模型在辨别与解决问题相关的信息方面存在一个关键缺陷,可能是因为它们的推理在常识意义上并不正式,而且主要基于模式匹配。”
研究人员表示,不同模型的测试结果各不相同。OpenAI 的 01-preview 模型得分下降了 17.5%,其前身 GPT-4o 模型得分下降了 32%。研究人员指出,即使是“最聪明”的模型也面临问题,并存在一些严重的缺陷。.
人工智能模型难以独立运行
测试还表明,人工智能模型在解决问题方面可能看起来很聪明,但一旦它们不再逐字逐句地抄袭别人的作业,就会显得力不从心。至于苹果公司,据报道,这家科技巨头明知测试结果,却仍然将其模型推向市场。
市场对此强烈反弹,包括 BBC 对该模式散布误导性信息的担忧,最终促使苹果暂停了该计划,直到修复为止。
苹果的AI功能原本旨在总结新闻通知,但它有时却自行捏造新闻,这令读者和新闻出版商非常不满。.
其中一条不实新闻推送声称拉斐尔·纳达尔是同性恋,并称一名被控谋杀美国保险公司老板的男子是自杀身亡。苹果公司的人工智能还错误地总结了BBC应用程序的通知,声称卢克·利特勒在PDC世界飞镖锦标赛开赛前数小时就赢得了冠军。.
1月6日,《纽约时报》一篇关于国会山骚乱四周年纪念日的报道似乎又出现了错误的摘要。.
苹果公司在发给BBC的一份声明中表示:“Apple Intelligence功能目前处于测试阶段,我们正在根据用户反馈不断改进。未来几周的软件更新将进一步明确显示哪些文本是Apple Intelligence提供的摘要。我们鼓励用户如果看到意外的通知摘要,请及时报告。 ”
苹果公司推出的这项有缺陷的功能是去年 12 月向部分新款 iPhone 用户发布的 AI 工具之一,这些 iPhone 包括 iPhone 16、15 Pro 和 15 Pro Max,以及部分 iPad 和 Mac。.

