埃隆·马斯克曾表示, iOS 和安卓平台上的 Grok Vision 都能解读摄像头拍摄到的内容。据马斯克称,Grok Vision 几乎可以理解摄像头指向的任何物体。
根据 X 上的公告,Grok Vision 智能且速度极快。公告写道: “Grok 可以分析你所看到的内容,进行解释,翻译文本,甚至还能查找产品并回答你的所有问题……只需用手机对准目标并提问……它真的非常棒。”
xAI推出的 Grok-1.5 Vision (Grok-1.5V)能够“处理各种各样的视觉信息,包括文档、图表、图形、屏幕截图和照片”。
Grok 的语音模式带有相机访问权限,用户可以将手机对准某个东西并问:“我正在看什么?”
Grok Vision几乎可以理解你摄像头对准的任何东西https://t.co/9IIpuhc32Z
——埃隆·马斯克(@elonmusk) 2025年9月26日
iOS 上的 Vision 功能允许聊天机器人通过设备的摄像头实时分析现实世界中的物体、文本和环境。.
用户可以扫描任何内容——产品、标牌、文档——Grok会立即提供上下文和信息进行分析。
Grok Vision发布之际,新的缺陷已被发现
此前,Grok发布了其“最新低成本推理模型”,而此次进展正是在此背景下发生的。据 Cryptopolitan看到的公告,该模型具有 200 万个代币的上下文窗口,并引入了一种统一的架构,该架构集成了推理模式和非推理模式。
xAI 报告称,Grok 4 Fast 采用端到端强化学习训练,能够自主决定何时使用外部资源,例如代码执行或网页浏览。这家科技公司表示,它可以快速浏览链接、观看 X 平台上的视频,并实时整合信息。.
此外,上个月,xAI 正式面向所有 SuperGrok 和 Premium+ X 订阅用户在其 iOS 应用上推出了Grok Imagine,这是一款图像和视频生成器。该生成器允许用户制作成人内容。Grok Imagine 据称能够将文本或图像提示转换为带有原生音频的 15 秒视频。
然而,这段历程并非一帆风顺。据《福布斯》8月份发布的一项调查显示,超过37万条与Grok的私人对话在用户不知情的情况下被包括谷歌、必应和DuckDuckGo在内的搜索引擎收录。.
此次泄露事件源于 Grok “分享”功能的一个缺陷,该功能会在用户分享对话时生成唯一的 URL。这些 URL 会matic提供给搜索引擎,实际上将私人聊天记录发布到了网上。.
埃隆·马斯克计划将注意力转向xAI(扩展人工智能)。
特斯拉股东将于11月投票表决一项投资xAI的提案,马斯克表示此举可能会塑造这家汽车制造商的未来。然而,董事会也在考虑一项万亿美元的薪酬方案,以确保他能够专注于特斯拉的发展。.
埃隆·马斯克的xAI公司提起 诉讼。诉讼称,OpenAI涉嫌挖走其员工,以获取与其人工智能聊天机器人Grok相关的商业机密。
xAI 的旗舰产品 Grok 聊天机器人目前拥有 6400 万月活跃用户。这家估值 1200 亿美元的公司虽然经历了领导层更迭,但仍在持续扩大招聘规模并完善基础设施。.
据报道,Meta AI 和 Grok 也在追赶领先的 AI 应用 ChatGPT。Grok 在网页端排名第四,移动端排名第 23。考虑到 Grok 在 2024 年底时还没有独立应用,如今取得这样的增长速度可谓迅猛。2025 年 7 月,Grok 4 发布后,其排名也增长了近 40%。.
然而,它与 ChatGPT 相比仍相形见绌,后者在 8 月份公布的周活跃用户数为 7 亿。与此同时,据CryptopolitanCryptopolitan,美国总务管理局 (GSA) 今日证实,已与 xAI 签署了一项为期 18 个月的 OneGov 协议,联邦机构只需支付每个机构 0.42 美元即可使用 Grok 4 和 Grok 4 Fast。

