阿里巴巴推出全新人工智能模型，声称其性能超越DeepSeek-V3。

作者：

柯林斯·J·奥科斯

阅读时长：3分钟发布日期：2025年1月29日

阿里巴巴发布了其Qwen 2.5 AI模型的新版本，即Qwen2.5-VL。.
该公司声称，其新的人工智能模型优于 DeepSeek 的人工智能模型。.
Philipp Schmid 表示，Qwen2.5-VL 是一种视觉语言模型，可以像 OpenAI 的 Operator 一样控制计算机。.

阿里巴巴于周三，即中国农历新年第一天，发布了其人工智能模型Qwen 2.5的新版本。这家中国科技公司声称，Qwen 2.5超越了备受好评的DeepSeek-V3。.

阿里巴巴在其官方微信公众号上发布消息称，其Qwen 2.5-Max的性能超越了几乎所有AI模型，包括GPT-40、DeepSeek-V3和Llama-3.1-405B。此前，该公司于1月10日发布了DeepSeek的AI助手（DeepSeek-V3），并于1月20日发布了R1版本。.

DeepSeek近期发布的R1模型引发了美国科技股的震荡，股价应声下跌，尤其是英伟达。DeepSeek声称，其R1模型的研发成本仅为60亿美元，而其他美国科技公司在人工智能领域的投入则高达数十亿美元。.

这家科技公司也带动了国内市场的一股热潮，其他中国科技公司纷纷发布人工智能模型的更新版本。路透社的一份报告显示，在DeepSeek-R1发布两天后，字节跳动也发布了其旗舰人工智能模型的更新版本。TikTok的母公司字节跳动声称，在衡量人工智能模型理解和响应复杂指令能力的测试中，其模型表现优于微软支持的OpenAI的o1。.

阿里巴巴发布新版Qwen2.5人工智能模型

DeepSeek V3 的爆发式增长吸引了trac人工智能社区对大规模 MoE 模型的关注。与此同时，我们一直在构建 Qwen2.5-Max，这是一个基于海量数据预训练并使用精心设计的 SFT 和 RLHF 算法进行后训练的大规模 MoE LLM 模型。它取得了极具竞争力的性能…… pic.twitter.com/oHVl16vfje

— Qwen (@Alibaba_Qwen) 2025年1月28日

这家中国科技公司周一宣布，其新推出的AI模型Qwen2.5-VL能够执行多种文本和图像分析任务。该公司还表示，Qwen2.5与OpenAI近期发布的Operator所使用的模型类似。该AI模型可以理解视频、解析文件、统计图像中的物体数量，甚至可以控制电脑。.

根据Qwen团队进行的基准测试，Qwen2.5-VL模型的性能优于 OpenAI的GPT-40、Anthropic的Claude 3.5 sonnet以及谷歌的Gemini 2.0 Flash。这款新型AI模型在视频理解、数学运算、文档分析和问答评估等方面有望超越竞争对手。

阿里巴巴确认，Qwen2.5-VL人工智能模型已在其Qwen聊天应用中开放测试，并可从AI开发平台Hugging Face下载。Qwen团队表示，该AI模型能够分析图表和图形，从发票和表格扫描件中trac数据，并“理解”长达数小时的视频。此外，该AI模型还能识别电影、电视剧以及各种产品的IP地址。.

Qwen团队透露，由于该人工智能模型由中国公司开发，因此在Qwen Chat中讨论的话题受到一定限制。据该团队称，中国互联网监管机构会对国内开发的许多模型进行评估，以确保其回复“体现社会主义核心价值观”。一些中国人工智能公司，例如 Ernie，也会回避可能引起监管机构不满或被认为过于敏感的话题。

Qwen团队揭晓Qwen2.5-VL的功能

Qwen2.5-VL 的开发团队透露，该人工智能模型的一大亮点在于其能够与 PC 和移动设备上的软件进行交互。Hugging Face 的技术负责人 Philipp Schmid 演示了该人工智能模型如何启动 Booking.com 的安卓应用，并预订从重庆飞往北京的航班。.

“尽管DeepSeek炒作不断，Qwenn却发布了最棒的开源多模态模型！Qwen 2.5 VL是一个视觉语言模型，它可以控制你的电脑，类似于OpenAI Operator，还能从图表中trac结构化信息等等！！”

– Philipp Schmid，Hugging Face 技术主管

Hugging Face 的数据科学家 Vaibhav Srivastav 展示了 Qwen2.5-VL 模型如何控制 Linux 桌面上的应用程序，但除了切换标签页之外，它几乎无法完成其他操作。这一演示与 Qwen 的基准测试结果相符，测试表明 Qwen2.5-VL 在 OSWorld 测试中得分很低，OSWorld 是一款旨在模拟真实计算机环境的基准测试软件。

这家中国人工智能技术公司还透露，Qwen2.5VL系列中两款规模较小、功能相对简单的型号——Qwen2.5-VL-3B和Qwen2.5-VL-7B——已采用较为宽松的授权许可。而旗舰型号Qwen2.5-VL-7B仍将采用阿里巴巴的定制授权许可，这意味着月活跃用户超过1亿的企业和开发者在商业部署该人工智能模型前，必须事先获得Qwen或阿里巴巴的许可。.

最顶尖的加密货币专家都在阅读我们的简报。想加入他们？

阿里巴巴 DeepSeeking 集团

分享这篇文章