机器开始制造机器:从自我改善到递归进化

Anthropic在报告中说:截至今年五月,其八成以上代码已由AI编写;人类工程师当下的代码产出量,约为两年前的八倍。这意味着,机器已开始制造机器。

 

报告还发现,Claude的“研究判断”能力,比想象中更接近人类——而这一直被视为人类独有的能力。

 

由此引出当前AI的两个核心命题。

 

一、AI的自我改进


即人类利用AI将AI打造得更强。模型可以飞速编写底层训练脚本、生成海量数据,甚至自动修复代码缺陷。这就像一位铁匠用手中的锤子,打出一把更称手的新锤子,次日打铁的效率显著提升——但决定权还在人类铁匠手中。

 

二、AI的递归自我改进


想象一下,那把锤子开始自作主张,自行调控炉温、修改桌上的图纸,再开动机器锻造出一把“更擅长修改图纸”的锤子。下一把锤子诞生后立刻接管工坊,越改越快。当新一代模型接管、重投循环,改进者同时也成了被改进者。

 

二者的根本区别在于:演化的目标,究竟由谁设定?

 

其中的鸿沟,在于一种被称为“研究品味”与“大局观”的抽象特质。

 

从底层机制看,递归改进缺一个即时且可信的裁判。代码飞轮之所以转得动,是因为有廉价而密集的“可验证奖励”——代码敲下,编译运行,对错当场分明。

 

但“研究判断”没有这种信号:一条技术路径是否值得走,答案往往要等数月甚至数年。一旦失去外部真实的对错反馈,AI的自我训练便会空转——自己出题、自己批卷、自己打满分,账面分数极高,能力却急剧退化。这叫“模型崩溃”。

 

更需警惕的是:一旦启动彻底的递归,一个极其微小的错置目标,经由代代相传,偏差会以指数级放大。

 

通往递归的路不像攀爬缓坡,更像在炉火上烧水:长久不见波澜,积累到某一临界温度,整壶水骤然沸腾。此谓“相变”。

 

Jack Clark预测,2028年底前出现完全自主递归的概率约有六成。这既需要底层算法的突破,也取决于人类是否“允许”。

 

一旦实现,未来的最强模型不再由人类心智写就,而是机器自我演化的产物。人类将无法读懂其内部的神经运作,只能观察其行为,推断其习性,为其划定边界。

 

那时,人类心智的价值将向两端收敛:一是追问意义的源头,二是在不确定的路口,凭直觉与大局观押下方向。其余的,交付机器。

 

相关产品

评论