告别“只会聊天的AI”:从OpenClaw到Miclaw,我们如何向Agent交出控制权
文 | 新识研究所
说实话,过去两年的大模型热潮多多少少带点幻觉。
我们曾经惊叹于OpenAI的GPT系列或者阿里的千问模型能写出多么华丽的诗句,能多么流畅地解答复杂的逻辑题。这些大型语言模型(LLM)用极短的时间奠定了AI“能说会道”的基础。一时间,仿佛通用人工智能(AGI)已经近在咫尺。
不过,当新鲜感褪去,真正把LLM塞进日常工作流里时,很多人会发现一种难以名状的无力感。这种无力感来源于LLM的一个核心痛点:它被锁在聊天框里,无法直接与现实世界互动。
举个最常见的场景。当你对着一个顶尖的大模型说:“帮我订一张下周三去北京的机票,把行程同步到我的日历,顺便给我的助理发个微信通知。”它会极其礼貌地回答你:“好的,建议您打开携程预订机票,然后进入日历添加日程……”它能给你提供完美的文本建议,甚至帮你写好发给助理的微信文案,但它就是没法替你“按下那个按钮”。它没有手,也没有脚。它无法控制你的本地设备,更别提接管你的智能家居了。
其实我更看重的是,AI到底能不能真正替人干活。如果AI只能停留在一个“聪明的咨询顾问”层面,那它对生产力的解放就永远有一层看不见的玻璃天花板。
直到最近,情况开始发生根本性的变化。我们在今年年初接连看到了两个具有标志性意义的转折点:一个是席卷开源社区的自主AI助手OpenClaw,另一个则是3月6日刚刚开启小范围封测的小米实验性手机AI代理Miclaw。
这两个项目的出现,标志着AI代理(Agent)时代的正式到来。如果说过去从传统软件到大模型的升级,像是由“功能机”迈向了“智能手机”;那么现在从LLM向Agent的转变,则类似于从“单一智能手机”跃进到了“全场景智能家居生态”。
AI不再是那个等着你输入Prompt(提示词)才动一下的算盘,而是开始更深、更主动地嵌入我们的现实生活。
这事说白了,AI终于要从“会说”,进化到“会做”了。
01 OpenClaw:开源代理的民主化力量
要理解这场范式革命,我们绕不开OpenClaw。这个脱胎于早期Clawdbot和Moltbot项目的前沿产品,在开源社区掀起了一场风暴。
如果平时不怎么逛开发者社区,你可能对它的火爆程度缺乏实感。我们可以看一组数据:根据国联民生证券在今年3月1日发布的产业点评报告,截至2026年2月24日,OpenClaw在代码托管平台GitHub上的星标(Star)数量已经突破了22.4万个。
这是一个什么概念?它超越了陪伴互联网世界数十年的Linux内核(21.8万星),创下了GitHub历史上最快的星标增长速度。
正如国联民生证券在报告中所评价的那样:“当市场看到其影响力可以和Linux内核站在同一水平甚至超过时,会意识到:OpenClaw的使用量增长带来的影响可能已经进一步深化,成为Agent生态中的重要‘事实检验标准’。”
为什么一个开源项目能让人如此兴奋?答案在于它赋予了普通开发者“造物”的权利。
OpenClaw并不是一个单纯的语言模型,它是一套基于LLM的任务规划引擎。它最核心的技术支撑在于引入了“heartbeat(心跳)”自主调度器和本地记忆模块。传统的AI需要你推一下才走一步,而拥有heartbeat机制的OpenClaw,就像拥有了数字心脏,它可以7×24小时在后台保持活跃,自主轮询任务、规划步骤并执行。
在实际功能上,OpenClaw可以直接在本地运行,拥有系统级权限。这意味着你可以通过WhatsApp、Telegram等日常消息软件,远程像给同事发微信一样给它下达指令。它能在你的电脑上自动运行Shell命令、整理混乱的本地文件夹、接管邮件收发、自动操作浏览器网页,甚至处理复杂的代码审查。
这里我想提一句,开源的魅力就在于民主化。过去,想要拥有一个高度定制化的企业级AI代理,往往需要向科技巨头支付高昂的订阅费用或API调用费。而OpenClaw打破了这种技术壁垒,让哪怕是普通的研究员或小微企业,也能在本地电脑上零成本部署一套属于自己的AI系统。
金融投研圈是最先闻到血腥味的群体之一。东吴证券在一份深度测评中直言,以OpenClaw为代表的新一代AI智能体,“正实现从‘问答工具’到‘可落地执行的干活助手’的本质蜕变”。它深度介入工作流,解决了LLM的“孤岛问题”。
浙商证券的评价则更为透彻,他们认为:“OpenClaw标志着投研工作范式从‘人力驱动型’向‘智能体驱动型’的跃迁……它本质上是‘智能体即服务’(Agent-as-a-Service)范式对专业工作流的重新定义。” 比如在量化研究中,分析师只需给出一个策略思路,OpenClaw就能自主完成因子研究、代码编写、策略复现、组合构建到回测的一条龙服务。
通过技能模块(Skill)的无限扩展和长期记忆的沉淀,OpenClaw实现了从静态模型到动态代理的华丽转身。它不再是一个你用完即走的网页,而是一个越来越懂你工作习惯的“数字打工人”。
02 Miclaw:商业化代理的移动端创新
如果说OpenClaw是极客和专业人士在桌面端的狂欢,那么小米刚刚推出的Miclaw,则是商业巨头将Agent推向大众移动端的关键一跃。
就在3月6日,小米宣布基于其MiMo大模型构建的AI交互测试产品Xiaomi Miclaw正式开启小范围封闭测试。它并不是一个简单的语音助手升级版,而是一个真正意义上的移动端Agent。
其实,移动端的AI革命比桌面端要难得多。手机系统的沙箱机制决定了,如果AI仅仅作为一个独立App存在,它的能力将极其受限。而Miclaw之所以值得关注,是因为它以系统应用的身份运行。
这种底层的技术支撑,让Miclaw拥有了“手”和“脚”。结合MiMo大模型在边缘部署上的能力与自然语言理解的优势,Miclaw实现了手机端流畅运行与精准意图识别。它能够理解用户的模糊意图,在获得授权后,直接调用第一方应用和生态能力,甚至自主选择系统级工具来完成多步工作流。
想象一下这个场景:你正在开车,收到朋友发来的一个网红餐厅推荐视频。过去,你需要记住餐厅名字,打开点评软件搜索,再切到地图软件导航。而现在,你只需要对Miclaw说一句:“帮我看看明晚这家店还有没有位子,有的话订个两人桌,然后把路线发给老婆。”
Miclaw会自动提取屏幕内容,理解上下文,跨应用调用订餐软件和通讯软件,完成这一系列操作。在这个过程中,它利用的是个人上下文理解、生态互联和自进化能力。
而且,Miclaw的野心显然不止于一部手机。依托小米庞大的“人车家全生态”,Miclaw的生态优势被无限放大。它推动着AI代理从单纯的云端算力,向边缘设备下沉。当Agent不仅能控制你的日程,还能在你快到家时提前打开空调、根据你的疲劳状态调节车内灯光时,AI才算真正接管了现实。
对比来看,OpenClaw和Miclaw代表了Agent发展的两条殊途同归的路径。OpenClaw高举开源大旗,强调高度的可定制性、系统级权限和多平台极客部署,它依靠社区的力量野蛮生长。而Miclaw则代表了商业巨头的标准打法:注重软硬件深度集成,强调“开箱即用”和普通用户的低门槛体验。
两者互为补充。开源社区负责探索技术的边界,而商业巨头负责加速大众的普及。
03 范式革命:从LLM到Agent的标志性转变
不管是OpenClaw的星火燎原,还是Miclaw的低调内测,背后都指向了一个不可逆转的行业共识:2023到2025年的LLM热潮已经翻篇,2026年是属于Agent的革命之年。
要真正理解这场革命,我们需要重新审视LLM与Agent的核心差异。
传统的LLM,本质上是一个极其庞大且聪明的统计学模型。它的运作逻辑是“提示-响应”:你输入一句话,它预测下一个最合理的词汇。它没有自主规划能力,没有调用外部工具的权限,更没有长期记忆。一旦对话框关闭,它就把你忘得一干二净。
而Agent(自主代理)则引入了一个完整的闭环:感知(Perception)、规划(Planning)、执行(Execution)、反思(Reflection)。
在技术层面,这就好比软件工程从“写死路径的脚本”向“自治系统”的飞跃。像OpenClaw这样的Agent,不需要你每一步都给予提示。它遇到一个大目标(比如“帮我分析一下最近A股的新能源板块”),会自主将其拆解为几个小任务:第一步去金融终端拉取数据,第二步阅读研报,第三步调用Python计算核心指标,第四步生成图表,最后汇总成报告发到你的邮箱。如果中间拉取数据失败,它的反思机制会促使它换一个数据源重试,而不是像LLM那样直接报错罢工。
在应用层面,这种转变打破了AI的“聊天框”限制,让其真正转化为现实生产力。我们前面提到过,如果是传统的LLM,你发给它一段长录音,它最多只能给你生成一个会议纪要模板。但如果是接入了工作流的Agent,它可以做到在会议结束后,自主从录音笔提取音频,进行语音识别,提取核心待办事项,然后将具体的任务分配到对应参会人的企业微信上,并在日历中设置好截止日期的提醒。
AI的角色,正在从一个被动的“辅助工具”,演变成一个具有主观能动性的“数字分身”或“数字同事”。
从生态影响来看,这种转变带来的冲击是巨大的。OpenClaw的开源模式极大地激发了社区的创新活力。短短时间内,开发者们为它贡献了数百个Skill(技能库),覆盖了从金融量化、自媒体运营到IT运维的方方面面。这种共识基础下的生态扩展能力,正在构筑起传统闭源模型难以企及的“护城河”。
与此同时,Miclaw等商业化产品的下场,则利用庞大的终端用户基数,在真实且复杂的应用场景中不断打磨Agent的容错率和执行效率。从2026年初OpenClaw在GitHub上的快速流行,到3月6日Miclaw的启动测试,时间节点上的巧合,恰恰印证了AI代理浪潮正处于爆发的最高峰。
04 结语与挑战:把方向盘交给AI之后
历史经验告诉我们,任何一次将控制权出让给技术的变革,都伴随着巨大的阵痛和风险。当我们从“人操作机器”走向“机器自主操作机器”时,挑战也就随之而来。
其实仔细想想,Agent带来的潜在风险比LLM要直观得多。LLM最多也就是“胡说八道”(产生幻觉),你听听就算了;但Agent如果产生了幻觉,它是真的会去执行的。
正如东吴证券在金工专题报告中所警示的:“OpenClaw与本地文件、业务数据或敏感信息交互,存在因权限配置不当、环境隔离不足导致的数据泄露、误操作等风险。”
一个拥有系统级删除权限的开源代理,如果理解错了指令,可能会清空你的工作盘;一个能自动调用支付接口的手机代理,如果遭到恶意指令注入,可能会造成直接的财产损失。
对于Miclaw这样深度绑定移动设备和智能家居的商业应用而言,如何在赋予AI系统级执行能力的同时,强化隐私保护、防止过度越权,将是决定其能否真正走向大众的生死线。
应对这些挑战,没有捷径可走。开源社区需要建立起更严密的权限管控规范和沙箱隔离机制;而企业侧,则需要在隐私保护计算和端侧模型加密上投入更多精力。更宏观地看,整个科技行业急需构建一套完善的AI代理伦理与安全框架,确保这匹脱缰的野马始终在人类的轨道上奔跑。
尽管前路仍有暗礁,但从OpenClaw到Miclaw的这股浪潮已经不可阻挡。AI的下一个十年,绝不仅限于屏幕上跳动的字符,而是关于自动化日常琐事、重塑工作流、解放人类生产力的宏大叙事。
当大航海时代的风帆再次扬起,无论是作为开发者、投资者,还是普通的数字公民,我们都不应只做岸上的旁观者。关注AI代理的发展趋势,尽早适应与“数字同事”共事的新节奏,或许是我们在这场技术大变革中,能够把握住的最好机遇。
智谱上线AutoClaw澳龙
延伸阅读:
华尔街为OpenAI IPO“摸底”,投资机构不待见?
OpenAI距离上市或许还有至少半年时间,但华尔街的预热工作已悄然展开。多家投资银行正主动接触公开市场投资者,试探市场对...
英伟达计划推出名为“NemoClaw”的开源AI智能体平台
英伟达计划推出名为“NemoClaw”的开源AI智能体平台,旨在帮助企业在工作流程中部署能够自主执行任务的AI代理。Ne...
AI预测权威:我还是低估了AI的速度,今年年底实现“AI研发自动化”真的有可能
人工智能能力的跃升速度,正在让最严谨的预测者也措手不及。知名AI预测研究者Ajeya Cotra近日公开承认,她仅在两个...
砺算科技将于3月12日在AWE2026现场举行显卡产品发售会
IT之家 3 月 10 日消息,砺算科技现已宣布,将于 3 月 12 日 14:30~16:30 在 AWE2026 中...
OpenAI继续补全产业版图:宣布收购网安初创公司Promptfoo,增强AI代理安防
智通财经APP获悉,OpenAI周一宣布收购网络安全初创公司Promptfoo。Promptfoo提供用于保护和测试复杂...
