谷歌推出了 Nano Banana Pro,这是一款基于 Gemini 3 Pro 构建的全新图像编辑和图像生成工具,并于周四通过一篇博客文章确认了该工具的推出。
Gemini 3 Pro两天后,Nano Banana Pro 也随之发布。Gemini 3 Pro 的发布推动 Alphabet 股价在周四早盘上涨了 4%。随着谷歌的人工智能模型在搜索、企业产品和媒体工具领域的需求不断增长,谷歌正将 Nano Banana Pro 直接纳入其人工智能产品线。
Nano Banana Pro 是 Nano Banana 的扩展版,后者于 8 月发布,并在网络上迅速走红。早期版本允许用户将自己的照片转换成 3D 立体人物,正如谷歌实验室和 Gemini 副总裁 Josh Woodward 在 9 月份撰文指出,该版本在短短四天内就为 Gemini 应用带来了 1300 万新用户。
乔什表示,新版本比在社交媒体上广为流传的版本功能强大得多。他告诉CNBC的迪尔德丽·博萨:“它在信息图表制作方面非常出色。它可以制作幻灯片。它最多可以处理14张不同的图片,或者5个不同的角色,并且还能保持角色的一致性。”
乔什还提到,内部员工已经用代码片段和LinkedIn简历测试了这款工具,Nano Banana Pro随后将它们转换成了简洁的信息图。他解释说,用户喜欢的是“这种将以前可能不会被视为视觉媒介的事物可视化的能力”。
Google 将 Nano Banana Pro 集成到 Gemini、NotebookLM 和 Search 中。
Nano Banana Pro 已集成到 Gemini 应用中,免费用户可获得有限的配额。它也内置于 NotebookLM、Google 的开发者和企业工具以及 Google Ads 中。
订阅了 Google AI Pro 或 Google AI Ultra 的用户可以通过 AI 模式在 Google 搜索中使用该工具。Josh 表示,该工具接下来将出现在 Google 的 AI 电影制作系统 Flow 中,Ultra 订阅用户将率先体验。
谷歌还在 Gemini 应用中添加了一项检测功能。任何人都可以上传图片,并查看该图片是否由谷歌人工智能生成。
免费版 Nano Banana 用户生成的图像会带有水印,而 Ultra 会员则不受水印限制。随着竞争压力的加剧,该公司正努力拓展用户在 Gemini 中的操作功能。
随着 OpenAI 更新 GPT-5,谷歌的 Gemini 项目持续增长。
谷歌仍在努力追赶 OpenAI,后者在 2022 年开启了生成式人工智能的竞赛。
OpenAI 上周发布了GPT-5,使其“默认情况下更热情、更具对话性”,并且“在日常使用中更高效、更容易理解”。
OpenAI 的 ChatGPT 现在是苹果应用商店排名第一的免费应用,而 Gemini 位居第二。
谷歌表示,Gemini 应用的月活跃用户超过 6.5 亿,而基于 Gemini 技术的 AI 概览的月活跃用户则高达 20 亿。10 月份,Sam Altman 表示 ChatGPT 的周活跃用户达到 8 亿,这表明谷歌正努力缩小与现有应用之间的差距。
乔什表示,越来越多的人付费订阅Gemini服务,是因为他们想要“一些高级型号更高的限额”。他还说:“我们看到很多产品都吸引了大量用户。这其实是最好的问题,因为需求很大,而我们正在努力寻找满足这些需求的方法。”
谷歌正致力于扩展 Gemini 旗下的所有业务。
其中包括 Flow(一款利用人工智能帮助构建完整场景的视频工具)和 Genie(一个世界构建系统,目前仅作为有限的研究预览版提供)。
乔希表示,这两个项目都是谷歌计划的一部分,旨在随着模型主导地位的争夺持续到 2025 年,并随着唐纳德·特朗普再次入主白宫,重塑整个科技行业的政策环境,不断扩大其系统规模。

