亚马逊支持的 Antropic 发布了 Claude 4,号称是其迄今为止最强大的 AI 模型组,旨在解决复杂任务。.
该公司 宣布 推出两款名为 Claude Opus 4 和 Claude Sonnet 4 的机型,它们能够分析“数千个数据源,执行长时间运行的任务”,以及撰写人类质量的内容。
Anthropic 的模型在某些基准测试中得分很高
据这家人工智能初创公司称,新模型在一些流行的基准测试中得分很高,表明 Opus 4 在编码任务和使用网络搜索等“工具”方面都优于 Google 的 Gemini 2.5 Pro、 OpenAI 的 o3 推理模型和 GPT-4.1 模型。
这两个模型都经过调整,能够很好地完成编程任务,因此也适用于写作和编辑。.
该公司的付费用户和使用免费聊天机器人应用程序的用户都可以访问 Sonnet 4,而 Opus 4 则仅限付费客户使用。.
Opus 4 的定价 为 每百万代币 15 美元/75 美元(输入/输出),Sonnet 4 的定价为每百万代币 3 美元/15 美元(输入/输出)。
词元是人工智能模型处理的原始数据,一百万个词元相当于大约 75 万个单词——比《战争与和平》长约 16.3 万个单词。
Anthropic 的首席科学官 Jared Kaplan 透露,该公司已于 2024 年底停止对聊天机器人的投资,但一直专注于提高 Claude 处理复杂任务的能力,包括研究和编码。.
卡普兰承认,“任务越复杂,模型就越有可能失控……我们正致力于解决这个问题,以便人们能够一次性将大量工作委托给我们的模型。”
“我认为这些模型作为智能体和tron都强大得多。内部 defi遇到了一些困难,因为我们用来训练这些模型的一些新基础设施……使得团队在确保一切正常运行方面非常紧张。”
卡普兰。.
Anthropic 公司对其 Opus 4 模型引以为豪,称其为“世界上最好的编码模型”,并且可以自主工作几乎整个企业工作日——小时。.
人为因素为这两个模型都添加了“思考总结”。
Anthropic 由前 OpenAI 研究高管创立,于 2023 年 3 月推出了首款聊天机器人 Claude,对 OpenAI 构成了压力。自此之后,该公司便卷入了竞争激烈的 AI 行业,尤其是初创企业之间的激烈竞争。.
与此同时,各行各业的企业都在竞相添加人工智能聊天机器人和代理,以保持竞争力,不被竞争对手甩在后面。.
现在,Anthropic公司为Claude 4的两款型号都增加了一项名为“思考摘要”的新功能。该功能可以将聊天机器人的推理过程浓缩成易于理解的见解。.
据 The Verge,“扩展思维”功能也已推出测试版,该功能允许用户在推理模式之间切换模型,或使用工具来提高回答的准确性。
这些模型还能够搜索网络,代表用户完成任务,并在推理和工具使用之间交替进行。当获得访问本地文件的权限时,这些模型可以trac并保存“关键事实”,以保持连续性并随着时间的推移构建隐性知识。.
“我和克劳德一起创作了很多作品,我认为在《作品4》和《十四行诗4》之前,我主要是把他们当作思考伙伴,但大部分的写作工作仍然是我自己完成的。”
人类学首席产品官迈克·克里格。.
“他们已经跨越了这个门槛,现在我的大部分作品实际上……主要是 Opus 的作品,而且现在这些作品与我以前的作品已经完全不同了,”克里格补充道。.
这些模型可在 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 平台上使用。.

