微软发布了Phi-4,这是其Phi系列生成式人工智能(AI)模型的最新版本。该精简架构融合了matic问题求解方面的最新进展。.
据报道,这款拥有 140 亿个参数的新模型旨在与 GPT-4o Mini、Gemini 2.0 Flash 和 Claude 3.5 Haiku 等其他紧凑型 AI 模型竞争。.
根据微软的博客,Phi-4 可通过微软的 Azure AI Foundry 平台有限访问,并且根据微软研究许可协议,其使用仅限于研究目的。
Phi-4:数学matic能力提升
微软将 Phi-4 定位为matic问题解决领域的领导者,并指出其性能相比前代产品和同类模型均有显著提升。据报道,Phi-4 在多项标准化基准测试中均取得了最高分,这令微软对该人工智能模型的能力dent 。.
在GPQA测试中,Phi-4得分56.1,超过了GPT-4o的40.9和Llama-3的49.1。在MATH基准测试中,Phi-4取得了80.4分,这体现了它在处理复杂matic问题方面的卓越能力。此外,它在编码基准测试中也表现出色,在HumanEval测试中获得了82.6分。.
此外,Phi-4 在实际应用场景中也展现了其卓越性能,包括在美国matic协会举办的美国matic竞赛 (AMC-10/12) 中取得高分。这些结果表明,Phi-4 在科学研究、工程和金融建模等领域具有潜在的应用价值,这些领域都对matic的准确性和推理能力要求极高。.
虽然像 OpenAI 的 GPT-4o 和 Google 的 Gemini Ultra 这样的大型模型拥有数千亿甚至数万亿个参数,但 Phi-4 证明,更小、更精简的架构可以在专门的任务中取得卓越的性能。.
微软将Phi-4的成功归功于高质量合成数据与人类生成内容数据集的整合,以及训练后阶段未公开的改进。这些努力反映了人工智能行业,即研究团队越来越关注合成数据使用和训练后优化方面的创新。
Scale AI 首席执行官 Alexandr Wang 最近强调了这一转变,他指出该行业已经遇到了“预训练数据瓶颈”,并补充说,各公司现在将竞相开发更高效的 AI 模型。.
计算固然重要,但数据同样重要,而我们已经遇到了预训练数据瓶颈。
— 亚历山大·王 (@alexandr_wang) 2024年12月12日
准备迎接后训练数据爆发吧。各公司将竞相获取最前沿的数据——多模态、智能体、复杂推理等等。
跟随数据,找到赢家。7
/8
负责任的人工智能和安全功能
微软持续强调负责任地开发人工智能解决方案,并在 Phi-4 及其前代产品中融入了强大的安全措施。通过 Azure AI Foundry,用户可以访问旨在评估和降低人工智能开发生命周期中各种风险的工具。.
这些工具包括提示屏蔽(用于防止不当或有害的输入)、受保护材料检测(用于dent输出中的敏感内容)和事实性检测(用于确保输出在事实上准确且相关)。.
此外,Azure AI 的内容安全工具包中集成了多项功能,使开发人员能够应用筛选器并监控应用程序的质量、安全性和数据完整性。实时警报可及时介入,以解决诸如恶意提示和内容偏差等问题。
Azure AI Foundry还支持使用内置指标和自定义指标进行迭代模型评估,使开发人员能够灵活地微调其 AI 应用程序以获得最佳性能。

