文章详情

XM交易:外媒:George Hotz警告AI编程代理或拖累代码质量

币界网报道:

外媒评论认为,围绕 AI 编程代理的争论,正在从“能否提效”转向“是否会拖累工程质量”。曾破解初代 iPhone 越狱和 PlayStation 3 的黑客 George Hotz 日前发文称,软件行业大规模采用这类工具,可能成为该领域代价极高的一次误判。

六个月实测后给出负面判断

Hotz 表示,他并非站在场外批评。过去六个月里,他在真实项目中持续使用 AI 代理,包括其开源深度学习框架 tinygrad 的部分开发,以及一款 USB-PCIe 芯片固件的完整逆向工程。

他的结论是,这类工具往往会在前期快速给出进展,但越到后面越难收尾。表面上看,模型输出越来越像样,真正的问题却更难被及时发现。按他的说法,开发者最后仍要频繁手动修补结果。

分歧不在效率,而在谁来兜底

文章认为,真正的风险不只是单次输出是否出错,而是组织层面的质量控制会不会失效。Hotz 的核心判断是,能力较强的工程师通常还能读懂生成代码,发现漏洞并决定何时信任工具;但能力较弱的工程师未必具备同样的校验能力。

如果后者借助代理把产出放大到过去的数倍,团队表面效率可能上升,但平均代码质量会更快下滑,而且这种下滑会被更高的提交量掩盖。Hotz 据此警告,行业可能迎来大量“看起来能用、实际上问题密集”的代码。

与 Karpathy 形成鲜明对照

这篇文章发布前不久,AI 研究员 Andrej Karpathy 刚加入 Anthropic 预训练团队。报道提到,Karpathy 对 AI 代理的态度在今年出现转变,认为新一代模型已明显改变软件开发方式。

Anthropic 首席执行官 Dario Amodei 此前也表示,公司部分工程师已经减少亲自写代码的比例,转而让模型生成代码,再由人类审核。Hotz 则给出了相反体验:他尝试过类似流程,但最终几乎每次都要自己动手修正。

随着“vibe coding”在过去一年快速流行,主要 AI 公司都把代理式编程当作重点方向。微软也已将 GitHub Copilot 推向更完整的代理化系统,并把这一变化描述为平台级转向。

Hotz 认为,问题不在于程序员是否担心被替代,而在于企业是否会在竞争压力下过快铺开工具。他点名提到,大公司若在整个工程团队中统一推进 AI 编码工具,未来两年的软件质量未必会因此改善。