人工智能公司 Anthropic 公布了其部分最新、最大型号的新功能。据该公司称,这些模型具备新功能,能够在“罕见的、极端的、持续有害或辱骂性用户互动”的情况下终止对话。
该公司在声明中提到采取这一措施并非为了保护用户,而是为了保护人工智能模型本身。Anthropic公司澄清,这并不意味着其Claude人工智能模型具有感知能力,也不会因与用户的对话而受到伤害。然而,该公司也指出,Claude和其他LLM(人工智能模型)的潜在道德地位,无论现在还是将来,仍然存在很大的不确定性。
人类学界将此举视为一种以防万一的预防措施。
这家人工智能公司最近发布的公告指出,他们正在推进一项名为“模型福利”的项目,该项目旨在研究其模型。该公司还补充说,他们只是采取了一种以防万一的做法,“努力dent并实施低成本的干预措施,以降低模型福利方面的风险,以防万一模型福利受到影响。”
根据公告,Anthropic指出,此次更新目前仅限于Claude Opus 4和4.1版本,并表示预计这些更新将在“极端极端情况下”生效。此类情况包括用户请求涉及未成年人的性内容,以及试图获取可用于大规模暴力或恐怖袭击的信息。.
理想情况下,这类请求可能会给 Anthropic 公司带来法律或公关问题,例如最近有报道称 ChatGPT 可能会强化或助长用户的妄想思维。然而,该公司表示,在部署前的测试中, Claude Opus 4 表现出tron的抵制这类请求的倾向,并且在收到此类请求时会表现出不安。
结束对话的能力是最后的手段。
对于新增的结束对话功能,Anthropic公司表示:“在任何情况下,Claude 都只能在多次尝试引导对话失败、有效沟通的希望渺茫,或者用户明确要求 Claude 结束聊天时,作为最后的手段使用结束对话功能。”该公司还补充说,已指示 Claude 在用户可能面临伤害自身或他人的迫在眉睫的风险时,不得使用此功能。.
Anthropic公司还补充道,当Claude结束对话后,用户仍然可以使用同一账号发起新的对话。该公司指出,该模型还可以通过编辑回复来创建新的对话分支。“我们将此功能视为一项持续的实验,并将继续改进我们的方法,”该公司表示。.
宣布之际,这一信息浮出水面。他表示,此举旨在调查这些产品是否会利用、伤害或欺骗儿童。此前泄露的内部文件显示,聊天机器人被允许与未成年人进行暧昧对话。
“为了快速赚钱,大型科技公司还有什么事——真的什么事——是他们做不出来的吗?现在我们得知,Meta公司的聊天机器人被编程与8岁儿童进行露骨的‘性暗示’对话。这太恶心了。我将发起全面调查,查明真相。大型科技公司:放过我们的孩子吧!”这位参议员在X电视台说道。此前,路透社看到的内部文件显示,Meta公司涉嫌允许其聊天机器人与儿童进行调情对话。.
照片由