阿里巴巴于周三,即中国农历新年第一天,发布了其人工智能模型Qwen 2.5的新版本。这家中国科技公司声称,Qwen 2.5超越了备受好评的DeepSeek-V3。.
阿里巴巴在其官方微信公众号上发布消息称,其Qwen 2.5-Max的性能超越了几乎所有AI模型,包括GPT-40、DeepSeek-V3和Llama-3.1-405B。此前,该公司于1月10日发布了DeepSeek的AI助手(DeepSeek-V3),并于1月20日发布了R1版本。.
DeepSeek近期发布的R1模型引发了美国科技股的震荡,股价应声下跌,尤其是英伟达。DeepSeek声称,其R1模型的研发成本仅为60亿美元,而其他美国科技公司在人工智能领域的投入则高达数十亿美元。.
这家科技公司也带动了国内市场的一股热潮,其他中国科技公司纷纷发布人工智能模型的更新版本。路透社的一份报告显示,在DeepSeek-R1发布两天后,字节跳动也发布了其旗舰人工智能模型的更新版本。TikTok的母公司字节跳动声称,在衡量人工智能模型理解和响应复杂指令能力的测试中,其模型表现优于微软支持的OpenAI的o1。.
阿里巴巴发布新版Qwen2.5人工智能模型
DeepSeek V3 的爆发式增长吸引了trac人工智能社区对大规模 MoE 模型的关注。与此同时,我们一直在构建 Qwen2.5-Max,这是一个基于海量数据预训练并使用精心设计的 SFT 和 RLHF 算法进行后训练的大规模 MoE LLM 模型。它取得了极具竞争力的性能…… pic.twitter.com/oHVl16vfje
— Qwen (@Alibaba_Qwen) 2025年1月28日
这家中国科技公司周一宣布,其新推出的AI模型Qwen2.5-VL能够执行多种文本和图像分析任务。该公司还表示,Qwen2.5与OpenAI近期发布的Operator所使用的模型类似。该AI模型可以理解视频、解析文件、统计图像中的物体数量,甚至可以控制电脑。.
根据Qwen团队进行的基准测试,Qwen2.5-VL模型的性能优于OpenAI的GPT-40、Anthropic的Claude 3.5 sonnet以及谷歌的Gemini 2.0 Flash。这款新型AI模型在视频理解、数学运算、文档分析和问答评估等方面有望超越竞争对手。
阿里巴巴确认,Qwen2.5-VL人工智能模型已在其Qwen聊天应用中开放测试,并可从AI开发平台Hugging Face下载。Qwen团队表示,该AI模型能够分析图表和图形,从发票和表格扫描件中trac数据,并“理解”长达数小时的视频。此外,该AI模型还能识别电影、电视剧以及各种产品的IP地址。.
Qwen团队透露,由于该人工智能模型由中国公司开发,因此在Qwen Chat中讨论的话题受到一定限制。据该团队称,中国互联网监管机构会对国内开发的许多模型进行评估,以确保其回复“体现社会主义核心价值观”。一些中国人工智能公司,例如Ernie ,也会回避可能引起监管机构不满或被认为过于敏感的话题。
Qwen团队揭晓Qwen2.5-VL的功能
Qwen2.5-VL 的开发团队透露,该人工智能模型的一大亮点在于其能够与 PC 和移动设备上的软件进行交互。Hugging Face 的技术负责人 Philipp Schmid 演示了该人工智能模型如何启动 Booking.com 的安卓应用,并预订从重庆飞往北京的航班。.
“尽管DeepSeek炒作不断,Qwenn却发布了最棒的开源多模态模型!Qwen 2.5 VL是一个视觉语言模型,它可以控制你的电脑,类似于OpenAI Operator,还能从图表中trac结构化信息等等!!”
– Philipp Schmid ,Hugging Face 技术主管
Hugging Face 的数据科学家 Vaibhav Srivastav展示了Qwen2.5-VL 模型如何控制 Linux 桌面上的应用程序,但除了切换标签页之外,它几乎无法完成其他操作。这一演示与 Qwen 的基准测试结果相符,测试表明 Qwen2.5-VL 在 OSWorld 测试中得分很低,OSWorld 是一款旨在模拟真实计算机环境的基准测试软件。
这家中国人工智能技术公司还透露,Qwen2.5VL系列中两款规模较小、功能相对简单的型号——Qwen2.5-VL-3B和Qwen2.5-VL-7B——已采用较为宽松的授权许可。而旗舰型号Qwen2.5-VL-7B仍将采用阿里巴巴的定制授权许可,这意味着月活跃用户超过1亿的企业和开发者在商业部署该人工智能模型前,必须事先获得Qwen或阿里巴巴的许可。.

