文 | 舒書
4 月 16 日,智元發(fā)布數(shù)據(jù)服務(wù)平臺、京東發(fā)布采集終端、小米密集宣發(fā)機(jī)器人進(jìn)展——三家企業(yè)同一天用不同的方式指向同一個方向:具身智能的競爭,正在進(jìn)入數(shù)據(jù)基礎(chǔ)設(shè)施時代。
但這不是一場建設(shè)競賽,是一場數(shù)據(jù)定義權(quán)與生態(tài)主導(dǎo)權(quán)的爭奪戰(zhàn)。誰先建立高價值數(shù)據(jù)的精煉能力、定義數(shù)據(jù)格式與接口標(biāo)準(zhǔn),誰就能掌控生態(tài)、讓對手的追趕成本高到無法競爭。
一、數(shù)據(jù)價值金字塔:修正與重估
行業(yè)最大的誤區(qū)是堆量即正義。真實(shí)的價值金字塔如下:

群核的核心技術(shù)是 AI 物理合成數(shù)據(jù)——從真實(shí)數(shù)據(jù)中學(xué)習(xí)物理先驗,再生成符合物理規(guī)律的數(shù)據(jù),無需手動搭建物理場景,可快速生成高保真失敗案例,適配多場景遷移。這與傳統(tǒng)剛體 / 柔體 / 流體仿真引擎的技術(shù)路線完全不同。
行業(yè)真相:據(jù)清華大學(xué)丁貴廣團(tuán)隊《具身智能數(shù)據(jù)采集與處理綜述》及行業(yè)調(diào)研,超過 90% 的采集數(shù)據(jù)在未經(jīng)精細(xì)化處理前,難以直接用于模型訓(xùn)練(重復(fù)動作、失敗無標(biāo)注、傳感器噪聲、無物理反饋)。真正的壁壘不是采集規(guī)模,而是高價值數(shù)據(jù)的精煉能力。
二、數(shù)據(jù)飛輪:具身智能沒有影子模式,怎么轉(zhuǎn)?
自動駕駛有幾百萬輛車在路上,每分每秒都在采集數(shù)據(jù)、回傳訓(xùn)練——這是天然的影子模式。機(jī)器人沒有。
這意味著:
采集成本必須由某個商業(yè)場景承擔(dān)。京東倉儲、小米工廠可以,因為機(jī)器人本身在生產(chǎn)。純數(shù)據(jù)服務(wù)商沒有場景,采集成本 100% 靠自己燒錢。
更有價值的是失敗案例數(shù)據(jù),但它們不會自動回流。自動駕駛可以對比 AI 決策和人類司機(jī)操作,自動發(fā)現(xiàn)失敗。機(jī)器人沒有這個對照。誰在做失敗案例的自動挖掘?目前幾乎沒有人。而這些失敗案例正是需要精煉的頂層高價值數(shù)據(jù)。
" 數(shù)據(jù)→模型→數(shù)據(jù) " 閉環(huán)是最大的技術(shù)壁壘。這不是簡單的采集更多,而是:評測→發(fā)現(xiàn)失敗模式→定向采集→模型迭代。沒有這個閉環(huán),再多數(shù)據(jù)也只是數(shù)字垃圾。
行業(yè)最大的認(rèn)知錯誤:以為采集規(guī)模等于數(shù)據(jù)壁壘。真正的壁壘是誰能讓數(shù)據(jù)自己長出數(shù)據(jù)。而這種數(shù)據(jù)自生長的能力,正是玩家們爭奪的核心,一場圍繞數(shù)據(jù)控制權(quán)的戰(zhàn)爭已全面打響。
三、玩家之間的戰(zhàn)爭:誰搶誰的生意?
沖突 1:智元覓蜂想做統(tǒng)一平臺,本質(zhì)是搶數(shù)據(jù)商的飯碗
智元做平臺:我定義接口,我定價,我抽傭,你們淪為外包采集工。帕西尼、光輪、巨身等頭部數(shù)據(jù)廠商必然抵制——這不是合作,是奪權(quán)之戰(zhàn)。
平臺模式的戰(zhàn)略價值在于網(wǎng)絡(luò)效應(yīng)和生態(tài)鎖定,而非短期盈利。初期的虧損是為換取長期生態(tài)主導(dǎo)權(quán)的必要投入。智元的真實(shí)路徑可能是 " 數(shù)據(jù) + 服務(wù) " 復(fù)合模式——用平臺聚合需求,用增值服務(wù)(清洗、標(biāo)注、仿真測試)賺錢,而非單純的抽傭平臺。
沖突 2:京東、小米的場景數(shù)據(jù),會不會封閉不對外?
京東物流數(shù)據(jù)、小米工廠數(shù)據(jù),是它們最核心的競爭壁壘。大概率封閉自用,不會開放給智元或其他廠商。這意味著數(shù)據(jù)基建不是統(tǒng)一市場,而是諸侯割據(jù)。
沖突 3:合成數(shù)據(jù) vs 真實(shí)數(shù)據(jù),路線之爭
群核的 AI 物理合成數(shù)據(jù)可以補(bǔ)物理規(guī)律、失敗案例、多模態(tài)對齊,成本遠(yuǎn)低于真機(jī)采集。如果合成數(shù)據(jù)足夠好,誰還愿意花數(shù)十萬 / 小時做真機(jī)采集?這不是合作,是替代。
目前合成數(shù)據(jù)仍無法完全替代頂層真機(jī)數(shù)據(jù),核心場景(如精密裝配、力控操作)仍需真機(jī)采集。兩者短期是互補(bǔ)關(guān)系,長期是替代關(guān)系。
沖突 4:標(biāo)準(zhǔn)之爭——誰定義數(shù)據(jù)格式,誰掌控生態(tài)
行業(yè)標(biāo)準(zhǔn)仍處于測試標(biāo)準(zhǔn)階段,不規(guī)定數(shù)據(jù)格式、接口、標(biāo)注規(guī)范。真正的戰(zhàn)爭在于:誰的數(shù)據(jù)格式成為行業(yè)默認(rèn)標(biāo)準(zhǔn)?就像 Google 的 Protocol Buffers、Facebook 的 Thrift ——數(shù)據(jù)格式的掌控者,就是生態(tài)的主導(dǎo)者。
四、商業(yè)模式:誰能賺錢?

真實(shí)成交價遠(yuǎn)低于數(shù)萬元 / 小時的紙面報價。據(jù)行業(yè)調(diào)研,2026 年一季度具身智能領(lǐng)域融資超 30 起、約 200 億元(數(shù)據(jù)引自 IT 桔子、36 氪等公開報道),百億估值公司已達(dá) 13 家。數(shù)據(jù)交易市場根本沒起來——合規(guī)、確權(quán)、定價機(jī)制全部缺失。智元現(xiàn)在的真實(shí)模式是 " 賣數(shù)據(jù) + 賣服務(wù) ",不是平臺抽傭。
五、中美路線對決:不同物種的戰(zhàn)爭

需要澄清的是:雙方的差異更多是戰(zhàn)略側(cè)重點(diǎn)和資源稟賦的不同,而非兩條涇渭分明的路線。特斯拉的 Optimus 同樣高度依賴其超級工廠的真實(shí)場景數(shù)據(jù)進(jìn)行迭代;中國的智源研究院等機(jī)構(gòu)也在大力投入通用具身大模型的研究。
終局判斷:短期看,中國在場景落地和硬件供應(yīng)鏈上占優(yōu);長期看,美國在底層模型、仿真引擎和生態(tài)標(biāo)準(zhǔn)上領(lǐng)先。兩條路線不會完全融合,但會相互滲透——中國的場景數(shù)據(jù)會催生更通用的能力,美國的通用模型也會向更多場景下沉。這種分化也讓行業(yè)面臨的泡沫、安全、合規(guī)風(fēng)險,呈現(xiàn)出不同的地域特征。
六、隱憂與挑戰(zhàn)
泡沫風(fēng)險:2026 年開年融資超 30 起、約 200 億元(IT 桔子、36 氪數(shù)據(jù)),百億估值公司已達(dá) 13 家。行業(yè)共識:一半以上最終會消失。
更值得警惕的是,當(dāng)前行業(yè)存在大量訂單水分——很多所謂的商業(yè)訂單是公關(guān)性質(zhì)的展示采購,而非真實(shí)的生產(chǎn)力替代?;⑿嵩晃恢顿Y人的判斷:" 真正在買單的是投資機(jī)構(gòu),本質(zhì)上是 To LP。" 瑞銀證券分析師也指出,當(dāng)前大量出貨流向科研機(jī)構(gòu)和數(shù)據(jù)采集中心,而非真實(shí)生產(chǎn)力需求。估值更多是信仰投票,而非對商業(yè)價值的理性定價。
物理安全:機(jī)器人采集 / 執(zhí)行時傷人、毀物、被劫持、越獄執(zhí)行危險動作——全球首個具身安全評測基準(zhǔn) AGENTSAFE 已發(fā)布,但行業(yè)整體仍處于補(bǔ)課階段。
數(shù)據(jù)合規(guī):數(shù)據(jù)權(quán)屬、隱私保護(hù)、跨境傳輸——制度性框架仍在建設(shè)中。機(jī)器人在家庭、工廠采集的數(shù)據(jù),到底屬于誰?目前沒有答案。
七、終局判斷:3 年演進(jìn)路徑

贏家的核心能力:
低成本高價值數(shù)據(jù)產(chǎn)能(群核的 AI 物理合成、帕西尼的超級工廠)
全鏈路自動化數(shù)據(jù)引擎(不是數(shù)據(jù)工廠,是學(xué)習(xí)閉環(huán))
場景壁壘(京東的物流、小米的工廠——這是數(shù)據(jù)來源的護(hù)城河)
標(biāo)準(zhǔn)與生態(tài)主導(dǎo)權(quán)(誰定義數(shù)據(jù)格式,誰就是生態(tài)的收稅人)
一句話判斷:具身智能下一個泡沫破裂點(diǎn),就是那些只會堆數(shù)據(jù)量、沒有數(shù)據(jù)引擎、沒有場景壁壘的公司。Demo 好看沒用,能自動迭代失敗案例才是壁壘。
結(jié)語
模型是表,數(shù)據(jù)是里,引擎是魂,場景是命。
4 月 16 日,智元、京東、小米宣告了數(shù)據(jù)基建時代的開啟。但這不是一場建設(shè)競賽,是一場數(shù)據(jù)定義權(quán)與生態(tài)主導(dǎo)權(quán)的爭奪戰(zhàn)。
誰的數(shù)據(jù)格式成為標(biāo)準(zhǔn),誰掌控生態(tài)。誰先跑通 " 數(shù)據(jù)→模型→數(shù)據(jù) " 的飛輪,誰就能讓對手的追趕成本高到無法競爭。
未來幾年,贏家不是做出最炫酷 Demo 的公司,而是那個最先建成數(shù)據(jù)精煉廠、最先跑通自動迭代閉環(huán)、最先搶占標(biāo)準(zhǔn)生態(tài)位的公司。
具身智能不是算力戰(zhàn)爭,不是模型戰(zhàn)爭,是數(shù)據(jù)飛輪的戰(zhàn)爭。而數(shù)據(jù)飛輪,只有少數(shù)人能轉(zhuǎn)起來。
本文基于公開信息分析,部分?jǐn)?shù)據(jù)引自 IT 桔子、36 氪、科創(chuàng)板日報、經(jīng)濟(jì)觀察網(wǎng)、清華大學(xué)《具身智能數(shù)據(jù)采集與處理綜述》等。