去年十月,苹果公司和康奈尔大学的研究人员悄然发布了 Ferret,这一举动在科技圈引发的轰动远超任何精心策划的发布会。这款开源的多模态大型语言模型 (LLM) 打破了苹果一贯的保密作风,标志着苹果在人工智能领域迈出了重要一步。Ferret 利用图像作为查询语言,其在 GitHub 上的低调亮相已激起了人工智能爱好者和研究人员的极大兴趣。.
在创新领域静谧的角落里,苹果公司和康奈尔大学的研究人员去年十月出人意料地发布了一款名为 Ferret 的开源多模态大型语言模型 (LLM)。这款在 GitHub 上悄然发布的模型起初并未引起太多关注,但如今已吸引了人工智能社区的广泛目光。.
雪貂的巧妙行动——深入了解
Ferret 的工作原理是检查图像中的特定区域,dent有价值的元素,并将它们框定在一个边界框内。这种新颖的方法允许用户将这些元素用作查询,促使 Ferret 以传统方式做出响应。.
例如,当用户选中一张动物图片并向 Ferret 询问其物种时,dent模型能够识别并做出相应的回应。Ferret 甚至可以利用图片中其他元素的上下文信息来提供更详细的答案,这展现了其独特的多模态能力。.
开源的 Ferret 模型具有在不同粒度级别上引用和建立各种元素之间联系的能力,这标志着苹果公司的重大转变,苹果人工智能研究科学家甘哲分享的见解也证实了这一点。.
苹果公司一向以行事低调著称,此次愿意与开源社区分享其人工智能技术进步,着实令人惊讶。这种新出现的开放态度使苹果成为多模态人工智能领域的重要参与者,挑战着业界的固有认知。.
苹果的战略转型——驾驭人工智能格局
Ferret 的发布不仅标志着苹果正式进军开源人工智能领域,也体现了该公司应对人工智能行业挑战的战略举措。正如科技博主 Ben Dickson 指出的那样,由于计算资源的限制,苹果面临着来自微软和谷歌等竞争对手的激烈竞争。与 ChatGPT 等模型不同,苹果的基础设施尚不具备大规模大型语言模型 (LLM) 的
苹果公司目前面临的困境使其面临两难抉择。第一个选择是与超大规模云服务提供商建立战略合作伙伴关系,以增强其人工智能能力。第二个选择,正如Ferret的发布所表明的那样,是采取类似于Meta Platforms Inc.的开源策略。在合作与社区共享之间做出选择,体现了苹果公司致力于在快速发展的人工智能领域保持竞争力的决心。.
当 Ferret 悄然探索多模态人工智能领域的未知领域时,苹果公司正站在一个超越单纯技术创新的十字路口。这款开源奇迹的发布,引发了一个关于苹果未来在人工智能领域发展方向的微妙问题。.
Ferret能否助力苹果跻身多模态人工智能领域的前沿,挑战行业规范并促进合作发展?或者,它是否象征着人工智能格局的更广泛转变,即行业巨头如何在专有技术优势与共享创新之间取得平衡?Ferret的悄然到来引发了人们的思考,也引发了人们对苹果在塑造人工智能未来中所扮演角色的猜测。答案将在技术、合作以及人工智能领域不断变化的动态交汇处揭晓。.

