文 | 窄播,作者|博斯
OpenClaw 作為一條技術(shù)路線,讓 Agent 第一次有了區(qū)別于聊天機(jī)器人的清晰輪廓:有一個(gè)人格化的靈魂,24*7 永遠(yuǎn)在線,主動(dòng)執(zhí)行任務(wù),看上去可以打理一切。舊勢(shì)力希望借此守住入口,新勢(shì)力想要利用它站上風(fēng)口。
3 月,從字節(jié)、騰訊、阿里、百度等互聯(lián)網(wǎng)巨頭,到月之暗面、MiniMax、智譜、階躍星辰等大模型新貴,再到華為、小米這樣的手機(jī)廠商,都在談龍蝦。新舊科技公司共同完成了一場(chǎng)將龍蝦廣而告之的共謀。
4 月,變陣之后的科技公司在繼續(xù)將龍蝦之戰(zhàn)從「極客的工具」推向「服務(wù)大眾的系統(tǒng)」。一方面在積極構(gòu)建支撐龍蝦類產(chǎn)品穩(wěn)定、安全運(yùn)營(yíng)的基礎(chǔ)設(shè)施;另一方面也在尋找龍蝦類產(chǎn)品能更快進(jìn)入的具體場(chǎng)景,將使用龍蝦與提升生產(chǎn)力劃上等號(hào)。
字節(jié)依然積極。4 月 2 日,「火山引擎 2026AI 創(chuàng)新巡展」武漢站上,火山引擎團(tuán)隊(duì)提出了敏態(tài)和穩(wěn)態(tài)并行的企業(yè) Agent 建設(shè)方法論,進(jìn)一步完善了 ArkClaw 和 HiAgent 兩個(gè)分別對(duì)應(yīng)敏態(tài)和穩(wěn)態(tài)的產(chǎn)品。4 月 7 日,字節(jié)旗下的扣子升級(jí)到 2.5 版本,不但有了龍蝦一樣的交互界面和執(zhí)行能力,還增加了 Agent Word 開放生態(tài)。

此外,OpenClaw 之外的新 Agent 形態(tài)還在繼續(xù)涌現(xiàn)。Hermes Agent 在 2 月開源之后,憑借自我成長(zhǎng)型 Agent 的定位在 4 月迎來(lái)的大爆發(fā)。目前,騰訊云已經(jīng)支持 Hermes Agent 的云端一鍵部署,小米也宣布旗下 Xiaomi MiMo-V2 系列大模型實(shí)現(xiàn)了官方集成接入。
大家此前都在討論誰(shuí)的龍蝦平替更好用,誰(shuí)的部署門檻更低,誰(shuí)的生態(tài)接入更方便。但在 4 月之后,大家可能會(huì)更傾向于討論這場(chǎng)狂歡的終局是什么,什么樣的產(chǎn)品形態(tài)會(huì)最終抵達(dá)主流市場(chǎng)。
從 500 萬(wàn)工程師到 10 億普通用戶,這中間的距離,與其說(shuō)是模型能力的問題,不如說(shuō)是產(chǎn)品化的問題。此刻的群雄逐鹿,在某種意義上,正是跨越這道鴻溝前的投石問路。
兩條探索的路徑
細(xì)看百蝦大戰(zhàn),各個(gè)廠商的選擇可以被歸納為兩條路徑。
動(dòng)作最密集的,是封裝 OpenClaw 的路線。它當(dāng)然是當(dāng)下最快的打法,也是大廠強(qiáng)烈的 fomo。
騰訊 QClaw、智譜 AutoClaw、MiniMax MaxClaw、百度 DuClaw、字節(jié) ArkClaw,這些產(chǎn)品的共同選擇是:暫且繞開對(duì) Agent 底層范式的重新定義,圍繞 OpenClaw 已經(jīng)驗(yàn)證過的能力做產(chǎn)品化包裝,是什么沒那么重要,做了再說(shuō)。
部署流程從小時(shí)級(jí)壓縮到 20 秒,從命令行腳本安裝到雙擊可用,云端托管、預(yù)置 Skill、預(yù)裝模型、免費(fèi)額度、主流 IM 接入一并打包交付。用戶觸達(dá)龍蝦的所有的門檻都在被快速降低。
這個(gè)路線核心指向:OpenClaw 太像一套開發(fā)者系統(tǒng),想要擴(kuò)大用戶基礎(chǔ),需要有人來(lái)把它翻譯成普通用戶能讀懂的語(yǔ)言。
這樣做能在短時(shí)間內(nèi),以最快速度圈住用戶。MaxClaw、AutoClaw、Kimi Claw 代表是大模型公司,將 OpenClaw 視作一個(gè)絕佳的 Token 消耗載體,讓人看到了 Token 經(jīng)濟(jì)學(xué)非常性感的一面。QClaw 和 ArkClaw 面向龍蝦時(shí)代變現(xiàn)了騰訊和字節(jié)的用戶基礎(chǔ),展示了舊入口 + 新產(chǎn)品的可行性。
但是,封裝路線的發(fā)展邏輯,在某種程度上依賴于上游不再生長(zhǎng),維持穩(wěn)定的產(chǎn)品框架。而對(duì)還需要不斷完善的 OpenClaw 來(lái)說(shuō),這個(gè)前提從一開始就顯得有些脆弱。OpenClaw 新版本和官方通道的每一次更新,都在悄悄左右著第三方產(chǎn)品的獨(dú)立生存空間。
互聯(lián)網(wǎng)巨頭們往往會(huì)選擇兩條腿走路,再走一條自研 Coding Agent,搭建自己執(zhí)行底座的路線。
相較字節(jié)和騰訊,阿里是這條路徑的更堅(jiān)定地執(zhí)行者。阿里巴巴通義實(shí)驗(yàn)室推出了開源的 QwenPaw,支持定制化輕量小模型、強(qiáng)化安全機(jī)制、支持多智能體協(xié)同作業(yè)、優(yōu)化長(zhǎng)期記憶管理。釘釘團(tuán)隊(duì)發(fā)布的悟空也是一款以企業(yè)智能體為核心的 AI 原生工作平臺(tái)。
釘釘?shù)暮诵膭?dòng)作,是把大量平臺(tái)能力 CLI 化,讓 Agent 原生調(diào)用平臺(tái)能力,不再模擬人的點(diǎn)擊操作。這背后有一個(gè)清晰的產(chǎn)品判斷:企業(yè)真正需要的,可能不是一個(gè)遠(yuǎn)程操控電腦的演示工具,而是能夠繼承組織權(quán)限、嵌入業(yè)務(wù)流程、可被審計(jì)和計(jì)費(fèi)的 AI 員工。

Anthropic 的 Cowork 不是「更易用的 Agent」,而是一種設(shè)計(jì)哲學(xué)的分野。OpenClaw 追求 Agent 的極致自主性,Cowork 追求的恰恰相反——更好的人機(jī)協(xié)作關(guān)系,一個(gè)讓人類能夠深度介入 AI 工作過程的協(xié)作環(huán)境。Cowork 要「從一個(gè)有用的助手,變成一個(gè)真正的全職同事?!?/p>

扣子 2.5 給自己的定位是「滿配 AI 伙伴」,與 OpenClaw 類似包含有人格、裝備、技能三個(gè)基礎(chǔ)部分,同時(shí)又為付費(fèi)用戶增加了使用云電腦和云手機(jī)的能力,有日程系統(tǒng)和文件系統(tǒng)。整個(gè)產(chǎn)品像一個(gè)更完善的龍蝦類產(chǎn)品。讓我驚訝的是,扣子 2.5 會(huì)自主提醒我某條信息可以被用于前兩天討論的某個(gè)選題上。
自研路線可以把 Agent 深度綁定進(jìn)自己的生態(tài)和權(quán)限體系,代價(jià)是研發(fā)更重、封閉性更強(qiáng)、擴(kuò)張更慢,往往只能先在自己的場(chǎng)景里站穩(wěn)腳跟,再圖謀更遠(yuǎn)的地方。
兩個(gè)真正關(guān)鍵的動(dòng)作
兩條路線,一重一輕,各有各的邏輯。但如果視野只停留在這兩條路上,可能會(huì)錯(cuò)過這場(chǎng)戰(zhàn)爭(zhēng)里真正懸而未決的那一部分。
龍蝦大戰(zhàn)背后的共識(shí)是,Coding Agent 正在成為新一代 Agent 的操作系統(tǒng)底座。競(jìng)爭(zhēng)的焦點(diǎn)是 Coding Agent 的交付完成度,即誰(shuí)能把 LLM、Coding Agent 和 Harness Engineering 整合成一個(gè)真正可以交付的系統(tǒng)。
這種競(jìng)爭(zhēng)在圍繞兩個(gè)關(guān)鍵動(dòng)作進(jìn)行:
第一個(gè)動(dòng)作是 CLI 的復(fù)興。這也是舊世界和新世界的聯(lián)結(jié)。Agent 的發(fā)展正在悄然分化出兩個(gè)界面:GUI 服務(wù)于人和軟件之間的交互,CLI 服務(wù)于軟件和 Agent 之間的交互。龍蝦類產(chǎn)品很有可能將對(duì)話窗口與 CLI 結(jié)合起來(lái),取代 GUI 主導(dǎo)的交互。
基于這個(gè)判斷,釘釘把辦公能力 CLI 化,某種程度上是在把自己改造成一個(gè)更適合 Agent 操作的執(zhí)行層。飛書 CLI 將協(xié)作能力接口化,也是把自己定位成「讓人類和 AI Agent 都能在終端中操作飛書」的命令行工具。他們都是在基于傳統(tǒng)軟件,長(zhǎng)出一套可以被 Agent 調(diào)用的操作界面。

第二個(gè)動(dòng)作是人類和 Agent 的協(xié)作。我們可以看到面前有兩個(gè)選擇:
一個(gè)選擇指向大一統(tǒng)的操作系統(tǒng)底座——以一個(gè)通用的平臺(tái)承載很多 Skill,由 Skill 覆蓋無(wú)數(shù)的垂直場(chǎng)景,就像微信上無(wú)數(shù)的小程序。
這個(gè)選擇中,Skill 本質(zhì)上是在把人類經(jīng)驗(yàn)、工作流經(jīng)驗(yàn)、行業(yè) know-how 和最佳實(shí)踐,壓縮成可以被 Agent 調(diào)用的能力模塊。通用平臺(tái)解決的是能不能做,Skill 解決的是該如何做、按照怎樣的經(jīng)驗(yàn)做、在什么上下文里做。如何讓用戶能夠高效封裝 Skill 會(huì)成為一個(gè)關(guān)鍵環(huán)節(jié)。
另一個(gè)選擇是 App 的 Agent 化。多個(gè)入口與多樣的垂直 Agent 構(gòu)成了類似當(dāng)下 APP 生態(tài)的行業(yè)格局。
如果說(shuō) Skill 是要將垂類 APP 拆分成多個(gè)原子化的能力,那么 APP 轉(zhuǎn)化成的 Agent 則是要維持相對(duì)孤島的狀態(tài)。類似我們通過自己的龍蝦調(diào)動(dòng)美團(tuán)的小美為我們點(diǎn)外賣。但這并不是個(gè)好選擇。
按照第一個(gè)選擇來(lái)發(fā)展,自然語(yǔ)言的交互是符合人最溝通習(xí)慣的,但目前的對(duì)話框式的交互界面不一定是最佳方案。這個(gè)答案還有可能是 NotebookLM 那樣的,輸入 - 整合 - 輸出的三框工作界面,也可能是 Flowith、可靈、即夢(mèng)都在嘗試的畫布式工作界面。
無(wú)論是什么界面,背后都需要足夠強(qiáng)大的 Skill 生態(tài)做支撐。而 Skill 生態(tài)的豐富程度可能會(huì)在未來(lái)決定人與 Agent 交互界面的最終呈現(xiàn)。
五點(diǎn)下班的可能性
對(duì) Coding Agent 或 Cowork 方向的產(chǎn)品來(lái)說(shuō),供給側(cè)的條件正在成熟,需求側(cè)的心智卻尚屬空白,海外的標(biāo)桿產(chǎn)品又因地緣因素?zé)o法直接進(jìn)入。三個(gè)因素疊加,構(gòu)成了一個(gè)罕見的機(jī)會(huì)窗口,也帶來(lái)了百蝦大戰(zhàn)的盛況。
但絕大部分用戶都不會(huì)是 pro user,未必有能力把自己的經(jīng)驗(yàn) Skill 化,也未必清楚什么是自己場(chǎng)景里的最優(yōu)解。大眾用戶期待的是一個(gè)能簡(jiǎn)單上手、直接干活的 Agent,而不是一個(gè)開放而強(qiáng)大、難以快速入門的底座。前者意味著直接的生產(chǎn)力,而后者只是一個(gè)帶來(lái)幻想的脆弱半成品。
我們不知道 Agent 什么時(shí)候真的會(huì)替代人類完成那些繁重的工作,但在這樣的旅途中一定會(huì)有一段時(shí)間,需要人類悉心的指導(dǎo)和檢查 Agent 如何產(chǎn)出一份可以完整交付的結(jié)果,直到 Agent 可以稱心如意地完成人類需要的工作。
這就像自動(dòng)駕駛行業(yè)有一場(chǎng)持續(xù)多年的路線之爭(zhēng):L4 派主張一步到位實(shí)現(xiàn)全自動(dòng),L2 派主張人機(jī)共駕、漸進(jìn)演化。最終,L4 定義了方向的想象空間,L2 贏得了真實(shí)的市場(chǎng)。其原因不在于 L2 技術(shù)上更先進(jìn),而在于它更務(wù)實(shí)地處理了人與機(jī)器之間那段需要時(shí)間積累的信任關(guān)系。
人類可能暫時(shí)還無(wú)法冀求一個(gè)無(wú)需工作的豐裕社會(huì),但從當(dāng)下的視角來(lái)看,一個(gè)編排良好的 Agent,確有讓人五點(diǎn)下班的可能性。