电竞比分网-中国电竞赛事及体育赛事平台

關(guān)于ZAKER 合作
硅星人 5分鐘前

別人都在卷 Harness, 而 Google 的沉默振聾發(fā)聵

今年 1 月,Google Gemini API 團隊的 Principal Engineer Jaana Dogan 在 X 上發(fā)了一條帖子,迅速獲得了數(shù)百萬次瀏覽。

" 我不是在開玩笑,這也不好笑。我們在 Google 從去年起就一直在嘗試構(gòu)建分布式 agent 編排系統(tǒng),各種方案,團隊內(nèi)部意見不統(tǒng)一。我給 Claude Code 描述了這個問題,它在一個小時內(nèi)生成了我們花了一年時間構(gòu)建的東西。"

她后來補充說,生成的只是一個玩具版本,不是生產(chǎn)級代碼。但她同時說了一句話," 我們不能一邊要求人們 100% 發(fā)揮,一邊讓他們不斷在沖突和爭論中消耗。"

三個月過去了,這條帖子背后的問題變得更加尖銳。據(jù)開發(fā)者調(diào)查數(shù)據(jù),Claude Code 在專業(yè)開發(fā)者中拿下約 41% 的市場份額,年化收入約 25 億美元,是 AI 編程工具領(lǐng)域有史以來增長最快的產(chǎn)品。OpenClaw 兩個月內(nèi)從開源項目迅速走紅為全球熱議的 agent 平臺,中國大廠飛書、釘釘、微信紛紛接入。"Agent harness" 成為 AI 行業(yè)最新、最熱的關(guān)鍵詞。

而過去這一周的密度更是驚人。Anthropic 宣布年化收入 run rate 突破 300 億美元(2025 年底為 90 億),同時發(fā)布了 Claude Mythos Preview,一個比現(xiàn)有 Opus 更強的新層級前沿模型,以 Project Glasswing 的名義定向開放給 Palo Alto Networks、Amazon、Apple 等 40 家機構(gòu)用于網(wǎng)絡安全防御,消息發(fā)布當天引發(fā)美國軟件股集體下跌。同一周還上線了 Claude Managed Agents,為企業(yè)提供托管的 agent 基礎(chǔ)設(shè)施,從沙盒到編排一站式解決。

Meta 發(fā)布了 Muse Spark,Alexandr Wang 領(lǐng)導的 Meta Superintelligence Labs 的第一個模型,放棄了此前堅持的開源路線,轉(zhuǎn)向閉源。OpenAI 不久前剛完成 1220 億美元融資,估值 8520 億美元,Codex 周活躍用戶超過 200 萬且仍在快速增長。

而 Google,在這一切中幾乎沒有聲音。

強模型,弱 harness

Ben Thompson 在今年 3 月的文章中點出了 Google 的核心問題,Gemini 是一款強大的模型,但谷歌尚未為其推出有說服力的 harness。(Gemini is a strong model, but Google hasn't yet shipped a compelling harness)。

所謂 harness,是圍繞 AI 模型構(gòu)建的編排和控制層,讓模型不只是在聊天框里回答問題,而是能在真實場景中穩(wěn)定地執(zhí)行多步驟、跨應用的復雜任務。Thompson 的判斷是,agent 時代的競爭關(guān)鍵已經(jīng)從模型本身轉(zhuǎn)移到了 harness。他用蘋果的硬件 - 軟件整合做類比,利潤從模塊化的、被商品化的部分流走,流向整合的、差異化的部分。

Anthropic 的 Claude Code 和 OpenAI 的 Codex 建立了模型與 harness 的緊密整合。Google 沒有。

Google 的 agent 產(chǎn)品并不少。Jules 是自動編程 agent,Antigravity 是 Google 以 24 億美元從 Windsurf 挖來 CEO Varun Mohan 等核心人才后組建的 agentic coding 平臺,Gemini Code Assist 在 IDE 里有 agent 模式,協(xié)議層面有 A2A 和 ADK 等開發(fā)者框架。消費端還有 Gemini Agent,能幫用戶管理郵件、日歷、執(zhí)行多步驟任務,不過目前只對美國的 Ultra 用戶開放,月費 249.99 美元。

但市場數(shù)據(jù)說明了一切。Antigravity 的開發(fā)者采用率與 Claude Code 差距明顯。不少用戶選擇在 Antigravity 內(nèi)切換到 Claude 的模型來獲得更好的編程效果。Composio 的對比測試中,同一個任務 Claude Code 用了 1 小時 17 分鐘自主完成,Gemini CLI 用了 2 小時 2 分鐘且需要人工干預,過程中 " 會陷入循環(huán),反復嘗試相同的方法 "。

Hacker News 上一個高贊帖子標題寫著,Google 在 agentic CLI coding 方面遠遠落后。How-To Geek 的評測說," 我兩個都大量使用過,根本不是一個量級的競爭。"

連 Hassabis 本人也在金融時報采訪中承認,Claude Code" 做了一些特別的東西 "。

這個 gap 到底是主動選擇還是被動落后?

Dogan 的帖子給出了一個很難回避的答案。" 各種方案、團隊意見不統(tǒng)一 ",這指向的不是戰(zhàn)略取舍,而是組織執(zhí)行力出了問題。Antigravity 上線后留不住想用 Gemini 寫代碼的用戶,Jules 在公測階段的數(shù)據(jù)(228 萬次訪問、14 萬次代碼改進)和 Claude Code 的增長曲線不在一個量級。這些不是選擇不做能解釋的,是做了但沒做好。

皮查伊和 Hassabis 的公開發(fā)言試圖把這呈現(xiàn)為一種優(yōu)先級選擇,強調(diào) Google 的資源傾斜給了模型訓練和 TPU 擴產(chǎn)," 先模型、再產(chǎn)品 "。但當你自家的 Principal Engineer 公開說 Claude Code 一小時干完了團隊一年的活,這個戰(zhàn)略選擇的說法就不那么有說服力了。

Gemini 在打另一場仗

把 harness gap 等同于 "Google 在 AI 上失敗了 ",是把問題簡單化了。Harness gap 是開發(fā)者工具這個特定賽道上的缺位,不是消費端的潰敗。事實上,如果你只看消費者數(shù)據(jù),Google 的 AI 業(yè)務看起來相當健康。

Gemini 的消費端數(shù)據(jù)依然強勢。月活 7.5 億,據(jù) Apptopia 數(shù)據(jù),在美國 AI 聊天應用的市場份額從 14.7% 增長到約 25%,網(wǎng)頁月訪問量突破 20 億次。

App Store 排名上,Meta AI 因 Muse Spark 發(fā)布沖進前十,Gemini 仍然穩(wěn)居第 3,僅次于 ChatGPT 和 Claude。

今年 3 月 Google 的產(chǎn)品更新節(jié)奏不慢。Gemini 3.1 Flash-Lite(Google 主打高吞吐低成本的輕量模型)、Gemma 4 開源模型(基于 Gemini 3 架構(gòu),Google 在開源生態(tài)的一次重要押注)、Workspace 全家桶 AI 深度整合、NotebookLM 持續(xù)迭代、Gemini Live 對話體驗升級、Pixel 手機上的 Gemini App Actions 開始支持跨應用操作。

只是這些更新的方向和行業(yè)熱點大部分錯開了。行業(yè)在討論 agent harness 和 coding 工具,Google 在做搜索整合、Workspace 生產(chǎn)力、手機助手。

Gemini API 的定價整體低于 Claude 和 GPT 等閉源模型(具體隨型號差異較大),且提供慷慨的免費額度,不過和 DeepSeek 等開源模型比,價格優(yōu)勢就不那么突出了。開發(fā)者社區(qū)形成了一種務實的分工,高價值項目用 Claude Code,追求性價比用 Gemini、開源模型。超過 75% 的企業(yè)組織已經(jīng)在生產(chǎn)環(huán)境中使用多個 AI 供應商。

皮查伊在最近一次播客中說,搜索團隊為每個子功能設(shè)定了毫秒級的延遲預算。Flash 模型達到 Pro 的 90% 能力,速度快得多。他說這完全不是一個 " 零和博弈的時刻 "。

Google 優(yōu)化的是十億級用戶的輕量體驗,搜索、Gmail、YouTube、Android,每一毫秒都在考量范圍內(nèi)。這個方向在過去二十年一直是對的。

但 agent 時代的邏輯可能不同。Claude Code 之所以引爆討論,恰恰因為它是一個獨立的產(chǎn)品,有自己的入口和體驗。OpenClaw 之所以爆發(fā),是因為它構(gòu)建了一個獨立的平臺。如果 harness 層成為下一個平臺級入口(就像搜索之于網(wǎng)頁、App Store 之于移動端),Google 在這一層的缺位就不只是不參與某個細分市場的問題了。

莊家不需要站在臺前

以上說的都是產(chǎn)品層面的事。但 Google 這家公司有一個其他 AI 公司不具備的特殊身份,它同時是 AI 行業(yè)最大的基礎(chǔ)設(shè)施供應商之一。就在 Anthropic 發(fā)布 Mythos、Meta 推出 Muse Spark 的同一周,Google 這邊的大新聞不是某個產(chǎn)品發(fā)布,而是一份 TPU 算力合同。

Anthropic 和 Broadcom、Google 在 4 月初正式確認了一份長期協(xié)議,從 2027 年起鎖定約 3.5GW 下一代 TPU 算力,據(jù) Broadcom 披露文件顯示合同延續(xù)到 2031 年。此前 Anthropic 已經(jīng)在執(zhí)行另一份價值數(shù)百億美元的合同,最多 100 萬顆 TPU,2026 年上線超 1GW 算力。

兩份合同疊加,Anthropic 的核心算力在未來五六年相當程度上綁定在 Google 的基礎(chǔ)設(shè)施上。Claude Code 越成功,Anthropic 需要的算力越多,Google Cloud 收到的賬單就越大。

OpenAI 也在用 TPU。2025 年年中開始通過 Google Cloud 租用 TPU 降低推理成本,推理目前占 OpenAI 算力預算的一半以上。Meta 在 2026 年 2 月放棄自研 AI 芯片 Iris 和 Olympus,轉(zhuǎn)投 TPU。

SemiAnalysis 指出了一個耐人尋味的現(xiàn)象,OpenAI 甚至還沒有大規(guī)模部署 TPU,但僅僅是擁有 " 可能轉(zhuǎn)向 TPU" 這個選項,就從 Nvidia 拿到了約 30% 的折扣,他們稱之為 " 威脅折扣效應 "。TPU 的存在本身就在重塑 AI 算力市場的定價權(quán)。

SemiAnalysis 對 TPUv7(代號 Ironwood)的評估是,性能與 Nvidia Blackwell 大致相當,但每有效 FLOP 的總成本低 20% 到 50%。

當然,TPU 的護城河也不是沒有挑戰(zhàn)。Anthropic 同時在用 TPU、Amazon Trainium 和 Nvidia GPU 三條腿走路,OpenAI 有自研芯片的長期計劃,Amazon 的 Trainium 在追趕。但至少在目前,TPU 的客戶名單還在變長,不是在變短。

皮查伊在播客中說他每周至少花一個小時管理 TPU 的項目分配," 按項目和團隊了解他們所使用的計算單元 "。CEO 親自管芯片,這件事本身就說明了在 Google 的優(yōu)先級里,算力遠比產(chǎn)品層的開發(fā)者心智更接近核心。

投資布局上,Google 持有 Anthropic 約 14% 的股份、SpaceX 的股份(SpaceX 在 2026 年 2 月收購 xAI 后,Google 間接持有 xAI 相關(guān)資產(chǎn))。AI 賽道的頭部玩家,Google 要么自己做,要么持股,要么賣算力。

Google 在科學和前沿技術(shù)方向的儲備也不應被忽略。Hassabis 和 Jumper 憑 AlphaFold2 獲得了 2024 年諾貝爾化學獎,Isomorphic Labs 在做 AI 藥物發(fā)現(xiàn),Genie 3 在探索交互式世界模型,機器人基礎(chǔ)模型在和 Boston Dynamics 合作,Waymo 已經(jīng)在多個城市運營無人出租車。這些和當下 agent 熱潮沒有直接關(guān)系,但構(gòu)成了 Google 獨有的技術(shù)縱深。

不一樣的 AI 路徑

4 月 22 日,Google Cloud Next 在拉斯維加斯開幕(美西時間)。5 月 19-20 日,Google I/O 緊隨其后。官方預告已經(jīng)明確提到 "agentic coding 和最新 Gemini 模型更新 "。接下來六周是 Google 集中亮牌的窗口。

但即便 Google 在這兩個會上發(fā)布了有競爭力的 agent 產(chǎn)品,它走的也注定是一條和 OpenAI、Anthropic 不同的路。

過去這一周的行業(yè)動作說明了一件事,所有玩家都在積極調(diào)整 AI 戰(zhàn)略。Anthropic 用 Claude Mythos 把前沿模型能力打包成了面向安全行業(yè)的定向產(chǎn)品方案,這種把模型能力快速產(chǎn)品化到特定高價值場景的動作,是 Google 目前缺少的。Meta 發(fā)布 Muse Spark 時放棄了堅持多年的開源路線,轉(zhuǎn)向閉源,試圖用 30 億月活用戶的分發(fā)優(yōu)勢追趕。OpenAI 在推 "AI 超級應用 " 的概念,把 ChatGPT、Codex 和瀏覽能力統(tǒng)一成一個 agent-first 的入口。

每家公司都在搶位置,Google 的相對沉默在這個背景下格外顯眼。

綜合皮查伊和 Hassabis 近期的公開發(fā)言,Google 的 AI 戰(zhàn)略邏輯比較清楚,不把 AI 當作一個獨立的產(chǎn)品類別來經(jīng)營,而是當作整個公司的加速器。皮查伊的原話是," 我們擁有這項通用技術(shù),它可以加速所有業(yè)務的發(fā)展,搜索、YouTube、Cloud、Waymo。"Hassabis 的 KPI 排序是先模型做到最好,然后盡快反映到產(chǎn)品中。

這和 OpenAI、Anthropic 的路徑完全不同。OpenAI 圍繞 ChatGPT 建立了獨立的消費者入口,然后向企業(yè)和開發(fā)者兩端延伸。Anthropic 圍繞 Claude Code 建立了開發(fā)者工具壁壘,再通過 API 和企業(yè)服務變現(xiàn)。兩家公司的共同點是都在做獨立的 AI 產(chǎn)品品牌,爭奪用戶的直接注意力。

Google 賭的是,長期來看模型會商品化,agent 產(chǎn)品會反復迭代和替換,但算力基礎(chǔ)設(shè)施和十億級分發(fā)渠道(搜索、Android、YouTube、Workspace)不會輕易被替代。與其在產(chǎn)品層和一堆初創(chuàng)公司逐個廝殺,不如守住基礎(chǔ)設(shè)施和分發(fā),等產(chǎn)品層面的格局明朗了再出手也不遲。

這個賭注是否正確,取決于一個關(guān)鍵假設(shè),harness 層不會成為一個鎖定用戶的平臺級入口。如果 agent 只是工作流的一部分,用戶會在 Claude、Gemini、GPT 之間靈活切換,那 Google 的 " 基礎(chǔ)設(shè)施 + 分發(fā) " 路徑就是對的,不需要在 harness 上贏。

但越來越多的跡象顯示,agent 正在演變成一個操作系統(tǒng)級別的界面。Claude Managed Agents 已經(jīng)在做這件事,harness 正在從產(chǎn)品概念變成基礎(chǔ)設(shè)施。那 Google 就可能在擁有最好的模型和最強的芯片的情況下,依然錯過這個時代最重要的產(chǎn)品窗口。這不是沒有先例的。Google 曾經(jīng)在即時通訊、社交網(wǎng)絡等領(lǐng)域擁有很強的技術(shù)基礎(chǔ),但在這些領(lǐng)域的產(chǎn)品競爭中并不總是贏家。

Gemini 3 在模型層證明了 Google 不會缺席。TPU 在基礎(chǔ)設(shè)施層證明了 Google 無論如何都會賺錢。真正懸而未決的是第三層,agent harness。Google Cloud Next 和 I/O 或許會給出第一批線索。

相關(guān)標簽

相關(guān)閱讀

最新評論

沒有更多評論了
硅星人

硅星人

硅是創(chuàng)造未來的基礎(chǔ),歡迎登陸硅星球。

訂閱

覺得文章不錯,微信掃描分享好友

掃碼分享

企業(yè)資訊

查看更多內(nèi)容