阿里巴巴集团控股有限公司推出了其最新的多模态人工智能模型 QwenVLo,这家中国科技巨头正不断巩固其在全球竞争日益激烈的人工智能领域的地位。.
该模型允许用户通过文本提示和视觉输入来创建和编辑图像,其功能旨在与 OpenAI 和 DeepSeek 等领先的 AI 开发商相媲美,甚至与之竞争。
Qwen2.5-VL 基线的改进版,并扩展了其功能,以支持文本到图像和图像到图像生成等新任务。
其中一个突出的特点是渐进式生成,这意味着用户可以在图像生成过程中看到它——这种透明度和交互性在当今大多数人工智能工具中都很少见。.
该公司在一篇博客文章中表示:“这款新升级的模型不仅‘理解’世界,而且还能基于这种理解生成高质量的再现作品。”.
该公司解释说,用户可以通过发送提示来生成图像,例如生成一张可爱猫咪的图片,或者通过上传猫咪照片并请求编辑来修改现有图像,例如在猫咪头上添加一顶帽子。.
阿里巴巴推出Qwen系列,深化人工智能战略
进军人工智能领域不再是阿里巴巴巩固其电商霸主地位的锦上添花之举。该公司自2024年初以来就一直在积极布局人工智能领域。.
今年2月,阿里巴巴首席执行官吴谨表示,这家电商和IT巨头将优先发展通用人工智能(AGI)。他强调,开发AGI已成为阿里巴巴的首要任务,凸显了人工智能对公司未来发展和竞争优势日益增长的重要性。
阿里巴巴已推出一系列Qwen品牌的人工智能模型,每个模型都针对特定的数据模式——文本、图像、视频和音频。QwenVLo取代了这些混合模式,旨在低端设备(包括手机和个人笔记本电脑)上运行;然而,与大多数最先进的人工智能模型不同,后者仍然需要大量的云计算能力才能高效运行。.
2025年3月,Quark发布了全新的Quark应用,其中包含了全新的Qwen功能。如今,该应用已发展成为一款人工智能智能助手,具备搜索、摘要和创意工具等功能。这体现了阿里巴巴致力于构建人工智能模型并将其融入消费者体验的决心。.
阿里巴巴在人工智能竞赛中挑战 DeepSeek 和 OpenAI
阿里巴巴发布QwenVLo之际,正值全球人工智能相关项目蓬勃发展的浪潮。总部位于美国的OpenAI发布了其迄今为止最先进的多模态模型GPT-4o,该模型能够理解文本、图像和音频并做出回应。.
在中国,所有人的目光都聚焦在DeepSeek身上,这家本土创业公司声称仅花费几百万美元就创建了一个具有强大竞争力的大型语言模型,因此成本效益正迅速成为人工智能开发成败的关键挑战。.
中国各地的科技巨头纷纷推出类似的AI服务,这些服务速度更快、价格更低、功能更强大。阿里巴巴旗下的Qwen Vlo是其中首批真正意义上的竞争者之一,它凭借高质量、低负载的多模态功能,有望与西方和中国的竞争对手一较高下。.
现在的竞争更多的是谁能构建最智能的模型,以及谁能将这种智能大规模地应用。.
阿里巴巴押注于那些每天使用应用程序的人群——dent、设计师、企业主和开发人员——将会涌向那些快速、简单易用且针对各种设备进行优化的工具。.
然而,Qwen VLo能否像其他一些知名品牌那样主导市场用户,目前还不得而知。但阿里巴巴已经反复强调:中国不仅在人工智能领域的竞争中与世界并驾齐驱,而且决心引领这一领域。.

