随着 OpenAI 和其他科技集团推出能够编写、修复和解释代码的工具,人工智能系统正在超越人类程序员,重塑软件的构建方式。.
总部位于旧金山的 OpenAI本周发布了dent测试表明这些模型在编码方面名列前茅。
该公司表示,GPT-4.1、o3 和 o4-mini 比之前的软件更能解决复杂的编码任务,因为后两个模型被允许进行额外的“推理”时间来思考查询。.
周三,OpenAI 还推出了 Codex CLI,这是一个免费的命令行助手,称其为 AI 代理,利用相同的模型来加速日常编码工作。.
Google 、Meta 和众多初创公司的举措相呼应
这些公司的领导者表示,专注于编程是该技术如何改变整个行业的“最切实的例子之一”,目前已有数千名开发人员在工作中使用这些新系统。.
OpenAI首席产品官凯文·韦尔本周在Overpowered播客节目中表示:“今年……人工智能将在竞技编程方面永远超越人类。”他将这一转变比作计算机击败国际象棋冠军的时刻,但他表示,如果“每个人都能创建软件”,那么这项新的突破对世界的意义将更加重大。.
LLM模型在识别代码模式方面越来越出色。
现在,开发人员只需在提示符中输入几句简单的句子,就能获得完整的可运行代码块。业内人士表示,LLM(语言学习模块)已经通过根据简短指令生成代码块,显著提高了软件开发速度。这些系统还会扫描错误并尝试修复,然后再由人工查看输出结果。.
过去十二个月里,这些模型在识别模式、推理问题和给出合乎逻辑的答案方面都取得了显著进步。2023年,人工智能在行业基准测试SWE-bench中仅能解决4.4%的问题。而今年,成功率跃升至69.1%。.
微软旗下的代码开发平台 GitHub 表示,目前 92% 的美国开发者依赖人工智能代码辅助工具。.
竞争日益激烈。Meta去年推出了Code Llama,它利用文字提示引导用户进行对话并编写代码。Anthropic在今年2月紧随其后,推出了Claude Code。Anthropic首席产品官Mike Krieger预测,工程师的角色将越来越侧重于“理解需求、团队协作,以及确保你开发的产品确实是正确的”。
“这更多的是关于倡导你的想法,”他补充道,并将未来的程序员比作“幕后操纵者或乐队指挥”,引导这些人工智能代理。.

