中国初创公司 MiniMax 发布了三款低成本开源 AI 模型,旨在与 OpenAI 的 ChatGPT 等顶级聊天机器人以及其他美国制造的模型竞争。.
据《南华早报》报道,此次多模态模型的发布距离竞争对手DeepSeek发布其开源模型树立新标准仅数周,加剧了中国大陆科技公司的竞争。
MiniMax发布了一系列功能各异的机型。
这家由阿里巴巴和腾讯投资的初创公司于周二发布了其模型。这些模型包括包含通用基础模型 MiniMax-Text-01 的大型语言模型 (MML) 套件,以及具备视觉功能的多模态模型 MiniMax-VL-01。.
据该公司称,其基础语言模型在包括解决数学问题在内的评估中,展现出的能力与世界领先的人工智能模型不相上下。在该公司发布于微信公众号的基准测试中,MiniMax 还展示了该模型的其他能力,包括领域知识、指令执行能力以及避免产生幻觉或事实错误的能力。.
基准测试还显示,其新模型的性能与闭源模型相当,而闭源模型通常被认为拥有业内最先进的功能。支持谷歌 Gemini、亚马逊投资的 Anthropic Claude 以及 OpenAI ChatGPT 等产品的模型均为闭源模型。这些模型通常在 Chatbot Arena(加州大学伯克利分校研究人员开发的 AI 基准测试项目)的排名中名列前茅。.
特别是 MiniMax-Text-01,其大小为 4650 亿个参数,在 MMLU 和 SimpleQA 等基准测试中表现优于 Google 最近发布的 Gemini 2.0 Flash,MMLU 和 SimpleQA 用于衡量模型回答数学问题的能力。
据该公司称,MiniMax-VL-01 在需要多模态理解的评估中可与 Anthropic 的 Claude 3.5 Sonnet 相媲美。.
就在几周前,总部位于杭州的竞争对手DeepSeek在去年12月发布了开源V3模型,震惊了全球科技行业。中国竞争激烈的AI市场日趋成熟,行业巨头和初创公司都陷入了激烈的AI霸主地位争夺战,每隔几个月就会发布新产品,彼此超越。.
MiniMax面临诸多挑战
MiniMax在竞争激烈的市场环境下发布了其新款产品。与此同时,香港上市公司商汤科技也于同一天发布了一款新的“一体化大屏手机”。.
据《南华早报》报道,专门评估中国模型的 SuperCLUE 进行的基准测试将商汤科技的新产品评为多模态模型中的佼佼者。.
尽管人工智能技术取得了长足进步,但中国初创企业在盈利方面仍面临挑战。像TikTok母公司字节跳动这样的大型科技公司财力雄厚,其旗下的豆宝在去年12月成为中国最受欢迎的聊天机器人,完全有能力免费向数百万用户推广其人工智能产品。
另一方面,初创企业需要在雄心勃勃的扩张和盈利努力之间取得平衡,以维持运营。.
MiniMax及其产品未来可能仍将面临困境。据《金融时报》报道,其配套应用Talkie是MiniMax的主要收入来源之一,但该应用已于去年年底因不明“技术原因”从美国苹果应用商店下架。不过,安卓版Talkie仍可在Google Play商店下载。.
MiniMax由中国最大的AI公司之一商汤科技的前员工于2021年创立。据TechCrunch报道,该公司的产品曾卷入一些小争议。例如,其应用Talkie中出现了包括唐纳德·特朗普、埃隆·马斯克和勒布朗·詹姆斯在内的公众人物的虚拟形象,但这些人似乎都没有同意出现在该应用中。.
《广播》杂志报道称,MiniMax的视频生成器可以生成英国电视台的台标。该杂志认为,这表明该公司的模型是使用这些电视台的内容进行训练的。
此外,据报道,这家位于上海的初创公司还被中国视频流媒体服务公司爱奇艺起诉,爱奇艺指控 MiniMax 未经授权使用爱奇艺的版权录像进行培训。.

