欢迎您访问欢迎来到沄森网,沄森智能旗下资讯平台!今天是:2026年05月11日 星期一 农历:丙午(马)年-三月-廿五
您现在的位置是:首页 > AI

从“造芯”到“做梦”,智能体自我进化提速

沄森™2026-05-11
  21世纪经济报道记者 陈归辞  近日,谷歌DeepMind的AlphaEvolve项目交出最新成绩单:由Gemini驱动的进化式编程智能体,不仅与菲尔兹奖得主陶哲轩合作攻克了数学难题,给Google Willow量子处理器设计了错误率降

  21世纪经济报道记者 陈归辞

  近日,谷歌DeepMind的AlphaEvolve项目交出最新成绩单:由Gemini驱动的进化式编程智能体,不仅与菲尔兹奖得主陶哲轩合作攻克了数学难题,给Google Willow量子处理器设计了错误率降低90%的电路方案,还给谷歌下一代TPU设计出了反直觉但更高效的电路方案,且该方案已被采用。

  几乎同期,Anthropic在Claude开发者大会上为托管智能体增加了一组新功能。智能体学会了“做梦”,能在两次工作间隙自动回顾历史对话、整理记忆、提取规律。配合自动评分功能和多智能体协作能力,任务完成率大幅提升。

  这些进展共同指向一个行业核心命题:智能体自我进化——AI正从被动等待提示词的代码工具,走向学会记忆、自我改进、持续进化的智能体。

  与用户共同成长

  回顾2026年初,OpenClaw(龙虾)的爆火让人们看到了个人AI助理普及的可能——你可以在微信或钉钉里直接和它聊天,让它自己去操作电脑、执行任务。

  但用户们很快发现,龙虾每天凌晨4点会刷新一次记忆,昨天刚说过的事情、刚纠正过的做法,第二天它就忘了,让交互体验大打折扣。

  3月到4月,“养马”开始兴起。由硅谷AI实验室Nous Research开发的开源智能体Hermes Agent,在海外技术社区走红。

  它主打持续学习和自我进化,拥有一套完整的学习闭环和多层次记忆系统,可以在完成复杂任务后自动沉淀经验、生成可复用的技能,下次遇到同类问题时会直接调用这些技能,并根据新的使用反馈不断自我改进。

  Hermes Agent的口号直白响亮:The agent that grows with you——一个与你共同成长的智能体。

  声网开发者社区副总裁杨慧在接受21世纪经济报道记者采访时表示,Hermes Agent抓住了智能体最核心的一点:人与智能体的关系,应由模型如何自我成长来定义,由智能体通过自我成长去主动适应人和帮助人,而不是由人单方面地向智能体下达指令。

  在以往人与AI的交互中,控制权是单向的——人不断下达指令,甚至要告诉AI“你记一下”。而Hermes Agent会主动更新自己的SKILL.md,觉得某个节点需要固化时,就会主动去做,变得“越来越懂”用户。杨慧指出,包括Kimi在内的模型厂商也在做类似的事情,只是各自尝试的做法有所不同。

  杨慧分享了自己的使用体验:“我常用Hermes Agent来写日报和周报,主要是搜索行业的最新进展并分析生成有设计的长图。随着使用时间变长,它变得越来越像我了。因为我不断跟它补充各种细节,比如它对行业产品的判断,主要来源于对技术的理解,而我除了技术理解之外,还对行业内的老玩家有更深的认识,这中间可能涉及业务转型等复杂背景。它会学习和记住我告诉它的这些信息。”

  这种持续学习的过程,本质是将经验压缩为可复用、可迭代的知识。它的另一个优势在于,即便用户更换底层模型,只要沿用同一套框架和技能,就能得到相同预期的输出。这意味着,用户可以根据不同任务灵活切换模型,而核心工作流的稳定性不会受到影响。

  “AI自造AI”加速到来

  除了让智能体在与用户的真实交互中沉淀经验、持续改进外,当前智能体自我进化的另一条主线,正深入到模型层与架构层的自我迭代。

  近年来,人工智能已经在算法自动发现、架构优化等方面实现突破,推动行业从“人设计算法”向“AI辅助发现算法”演进。

  当前,国内外头部模型厂商正纷纷让AI参与到自身下一代版本的开发、训练或优化中。除了前述Anthropic最新发布的具有自我进化能力的Claude托管智能体、谷歌DeepMind的AlphaEvolve项目外,国内MiniMax在2026年3月发布了M2.7模型,被其官方称为“第一个模型深度参与迭代自己的模型”。

  据MiniMax介绍,M2.7能够自行构建复杂的Agent Harness(智能体驾驭系统),并依托Agent Teams(多智能体团队)、复杂Skills(技能)、Tool Search Tool(工具搜索工具)等能力,完成高度复杂的生产力任务。

  例如,在研发M2.7的过程中,团队基于模型构建了强化学习Harness中的数十个复杂技能,持续更新自身记忆,驱动模型自身的强化学习,并根据结果不断优化强化学习流程和Harness,开启模型的自我进化。

  “在M2.7的训练中,我们的RL pipeline(强化学习流程)里70%到80%的工作已经由‘模型+智能体’完成了。”MiniMax智能体首席架构师阿岛此前在一场对谈中透露。

  Kimi则将多智能体协作能力作为重点之一。从K2.5开始,Kimi已从单个智能体进化到了智能体集群——K2.5会创建并协调一群专项智能体并行工作,这些智能体都是它的分身,各自承担不同角色和子任务,没有预设规则,所有的角色分配和任务拆解,都由K2.5现场即时决定。

  迭代至K2.6,架构完成扩容和升级,最多可调度300个子智能体并行完成4000个协作步骤,能够支持调度不同技能特长的智能体进行互补协作、组合各项能力。

  Kimi创始人杨植麟不久前预判,越来越多的研究工作将由AI主导。未来每个研究员将配备海量的Token,由AI自动合成新任务、构建新环境、定义最优奖励函数。

  “AI自造AI”的进程正在加速。前xAI联合创始人Jimmy Ba今年2月曾预测,递归自我改进循环很可能在未来12个月内上线。而Anthropic联合创始人Jack Clark近日则在社交媒体上表示,他认为到2028年底,递归自我改进发生的概率有60%。

  “也就是说,AI系统可能很快就能自主构建和改进自己,进入自我加速的阶段。”Jack Clark表示。

所有文章未经授权禁止转载、摘编、复制或建立镜像,违规转载法律必究。

举报邮箱:1002263188@qq.com

相关标签: