搜索引擎巨头谷歌周三推出了 Gemini 2.0,这是一个实验性模型,可以独立使用网站,基本上是一个“万能”模型。
谷歌首席执行官桑达尔·皮查伊表示,最新模型将使用户能够构建新的AI代理,从而“使我们更接近通用助手的愿景”。该公司称其模型是“迄今为止为智能体时代打造的最强大的模型”。
这些举措是该公司为应对科技行业与 Meta、微软和 Meta 等公司日益激烈的竞争而采取的措施之一。.
谷歌将在旗下产品中推广该模式。
皮查伊还公布了最新款处理器模型,该模型具备多模态功能,将应用于谷歌旗下所有产品,包括原生图像和音频输出。这家搜索引擎巨头于去年12月发布了Gemini 1.0,谷歌称其为首款“原生多模态”处理器,这意味着该处理器可以处理并响应文本、视频、图像、音频和代码查询。.
最新版本代表了谷歌在竞争日益激烈的科技行业人工智能竞赛中的最新努力。.
“如果说 Gemini 1.0 的目的是组织和理解信息,那么 Gemini 2.0 的目的就是让信息更有用。”
皮查伊。.
Gemini 2.0 距离 Google 首次推出 1.5 版本已经过去了近 10 个月。据 Google 称,该模型仍处于实验预览阶段,目前只发布了一个版本,即尺寸更小、配置更低的 2.0 Flash 版本。.
谷歌DeepMind首席执行官兼公司人工智能业务负责人德米斯·哈萨比斯表示,这对这家科技巨头来说仍然是意义重大的一天。.
“它和目前的Pro型号一样好。所以你可以把它看作是提升了一个档次,同时保持了相同的性价比、性能和速度。我们对此非常满意,”哈萨比斯解释道。.
目前,只有开发人员和测试人员可以率先获得 2.0 版本,而其他 Gemini 用户可以使用 2.0 Flash 实验模型,该模型基于 1.5 Flash 版本,而 1.5 Flash 版本是当时推出的最快、最具成本效益的模型。
谷歌宣布推出一系列新功能
据该公司称,他们计划将新模型的推理能力添加到“人工智能概览”功能中。皮查伊表示,该功能目前已拥有10亿用户,并已成为集团最受欢迎的搜索功能之一。.
皮查伊进一步强调,借助这一新模型,AI Overviews 现在能够处理复杂的多步骤查询,例如matic方程式和多模态问题。.
虽然最新型号的有限测试已于本周开始,但推理功能要到明年年初才会向更多用户开放。.
据谷歌称,该推理模型运行于谷歌第六代人工智能芯片Trillium之上,该芯片也于周三开始向谷歌云客户开放。
在其博客文章透露,新款芯片的性能比上一代产品提高了 4 倍,能效提高了 67%。
我们正式开启 Gemini 2.0 时代,首发产品是 Gemini 2.0 Flash,其在关键基准测试中性能超越 1.5 Pro,速度提升 2 倍(见下图)。我尤其欣喜地看到代码编写方面取得的快速进展,未来还将有更多惊喜。.
开发者可以在人工智能领域试用实验版本…… pic.twitter.com/iEAV8dzkaW
— Sundar Pichai (@sundarpichai) 2024 年 12 月 11 日
谷歌首席执行官还宣布了其他功能,例如名为“深度研究”(Deep Research)的全新 Gemini 功能。该功能利用高级推理和长上下文信息,可以充当研究助手。这项新功能在 Gemini Advanced 版本中可用,能够代表用户生成研究报告。.
哈萨比斯表示,双子座2.0计划正在为2025年的辉煌奠定基础。.
“我们认为 2025 年才是真正意义上的代理时代开始。”
哈萨比斯。.
此前,该公司宣布推出另一款产品Project Mariner ,这是一款实验性的全新 Chrome 扩展程序,可让用户真正使用网络浏览器。
此外,谷歌还宣布推出 Jules(一款专门为帮助开发者查找和修复错误代码而创建的代理)以及一款基于 Gemini 2.0 的全新代理,该代理可以查看用户的屏幕并帮助他们更好地玩电子游戏。.
据 Hassabis 称,他称之为“彩蛋”的游戏代理表明它是真正的多模态的。.

