当 谷歌 收录了 Pulumi AI(一家利用聊天机器人创建模板的 AI 开发商)生成的糟糕的基础设施即代码输出时,我们看到这些人工智能实体出现在谷歌搜索结果的顶部。
人工智能内容的兴起
“Pullumi”的故事是这样的:它会“根据用户输入的提示信息生成结果,并显示在其AI答案子网站上”。这些机器人回复会被谷歌排名爬虫索引,主要是因为AI答案通常不恰当。.
Arian van Putten周末在社交媒体上引用开发者的话“事情已经发生了”。谷歌搜索结果的第一条应该是Pulumi官方手册,其中包含LLM(机器学习模型)的内容,并附带一条通知,指出LLM生成的内容会虚构出一个并不存在的AWS功能。.
这事儿发生了。谷歌搜索结果排名第一的竟然是 Pulumi 的官方文档页面,显然是由一个法学硕士写的(页面上还有免责声明),而且虚构了一个根本不存在的 AWS 功能。这真是个灾难的开始。
— Arian van Putten (@ProgrammerDude) 2024年4月29日
正如注册官在2022年所指出的,人工智能生成的内容已经出现,但其质量却备受质疑。人工智能生成的内容更容易被搜索引擎收录,并在搜索结果中优先显示。.
为了支持 Pulumi AI 及其 AI Answers 库的功能和内容,在线回复是另一种体现其设计的数据类型。Pulumi 等工具支持的“基础设施即代码”技术生成 AI 的输出结果,而 Google 搜索爬虫会对其进行索引,并将其与指向人工撰写的网站内容的链接一起呈现给搜索用户。AI 系统生成的此类文档和代码片段促使其他开发者发现,许多系统都产生了不准确甚至更糟糕的、无法正常运行的结果。.
搜索排名问题
问题出现在2024年3月21日,Pete Nykänen发现了这个问题,并将其发布在GitHub上一个专门讨论 Pulumi AI的。“最近,我在谷歌上搜索与基础设施相关的关键词。我发现了一个令人不安的趋势:无论是否有人问过相关问题,Pulumi AI的回复都会排在搜索结果的第一位,并显示在谷歌搜索结果页面上。这种情况甚至会持续多次搜索,所以我确信随着时间的推移,这个问题会越来越严重。” Nicky在给The Register的一封电子邮件中表示,他开始注意到Pulumi AI的搜索问题。
首席执行官指出:“我们工程师花了很多时间在网上寻找答案,我晚上搜索一些与 Pulumi 或人工智能本身都无关的关键词时,总能在搜索结果的顶部看到人工智能。”
尼凯宁认为,人工智能目前在搜索结果中占据主导地位。随着越来越多的公司不断开发内容生成程序,人工智能专业人员在实际工作中的参与至关重要,并可能对网络的公信力产生不利影响。.
AI 在文档编写中发挥的另一个作用是,尽管 AI Answers 涵盖了超过一半(几乎三分之二)关于使用服务的主题,但 Pulumi 的 AI 工程师 Aaron Friel 建议终止新的 AI Answers。.
质量审查
Friel提到API页面是Pulumi推出的另一项举措,Pulumi会在其中讨论与上游相关的实际案例或文档。谷歌在一个月后才意识到这一点,他们测试了输出代码并将其列入了待办事项清单。“AWS LightSail X-Ray”是《The Register》周一使用的搜索关键词,Pulumi AI的搜索结果接近第二名。下周二,当他们再次输入相同的关键词时,结果却出乎意料地排在了第一位——甚至超过了AWS官方文档。
他们就当前形势询问了 谷歌 的看法,一位谷歌代表表示:“公司一直致力于展示最高质量的信息,但在查询列表中的某些狭窄主题上,网络上可能没有任何高质量的内容可以排名第一。”
这家搜索巨头进一步断言,其政策基于这样一个事实:“大规模炮制低质量内容,其唯一目的就是为了扰乱搜索排名,这种内容被视为垃圾信息”,而最近增强的技术针对的是搜索结果中 45% 的此类非原创/完全无用的内容。.
微软的搜索引擎必应在后台找到了一个针对同一查询的维基百科页面示例。虽然必应搜索引擎的AI生成内容本身没有问题,但其搜索结果中包含一个聊天按钮,如果你点击该按钮就会弹出。此外,勇敢者论坛也遗漏了Pulumi AI的答案。.
根据 DuckDuckGo 的数据,在搜索“人工智能产品包含哪些组件”时,Pulumi AI 的结果在其搜索结果页面 (SERP) 上排名第四。Duffy 表示,Pulumi 的代码质量经过反复测试和改进。该公司发现,代码示例的成功率每个季度都实现了两位数的增长。.

