电竞比分网-中国电竞赛事及体育赛事平台

關(guān)于ZAKER 合作
雷鋒網(wǎng) 14小時(shí)前

做了 5 年 3D 打印機(jī),我發(fā)現(xiàn)了世界模型的 Scaling Law

2026 年初,英偉達(dá) CEO 黃仁勛在 CES 上喊出 " 物理 AI 是第二個(gè)拐點(diǎn) " 后,世界模型(World Model)成了全球科技巨頭的必爭(zhēng)之地。

但在這之前,學(xué)術(shù)界就有很多學(xué)者已經(jīng)意識(shí)到, AI 必須理解物理世界的常識(shí),才能真正服務(wù)于人類(lèi)。但隨著 AI 教母李飛飛,Meta 前首席 AI 科學(xué)家、圖靈獎(jiǎng)得主楊立昆等大佬紛紛投入這一領(lǐng)域,大家逐漸意識(shí)到,這是一個(gè)比大語(yǔ)言模型更底層、也更難啃的賽道。

當(dāng)我們?cè)趪?guó)內(nèi)尋找這條賽道上的學(xué)者和公司時(shí),陳天潤(rùn)進(jìn)入了我們的視野。

這位 2000 年出生的在讀博士生,在 2022 年創(chuàng)立魔芯科技,用 3D 打印機(jī)完成從 0 到 1 的驗(yàn)證后,于 2024 年全面轉(zhuǎn)型空間智能。

" 造小家電的 "、" 3C 產(chǎn)品創(chuàng)業(yè)出身 " …… 在對(duì)談中,這位 00 后對(duì)自己的介紹極度克制。但實(shí)際上,他不僅是一家 " 估值數(shù)十億 " 的世界模型領(lǐng)域公司 CEO,還是潘云鶴院士的弟子。

不久前,魔芯科技憑借著空間智能與世界模型方面的突破,順利拿到了華為、聯(lián)想等巨頭聯(lián)手的數(shù)億元融資,如今,他們對(duì)自己的定位是空間智能的基礎(chǔ)設(shè)施服務(wù)商。

在這次對(duì)談里,陳天潤(rùn)一邊輸出空間智能相關(guān)的技術(shù)性話(huà)題,一邊從創(chuàng)業(yè)者角度跟我們分享他在商業(yè)化方面如何將一秒鐘視頻生成成本控制在一毛錢(qián)以?xún)?nèi)。

在 3D 打印的 " 修羅場(chǎng) " 里被卷了五年,我們能看到他拼殺出來(lái)的商業(yè)化能力,對(duì)比很多 AI 公司,雖然科研很強(qiáng),但不知道怎么把技術(shù)變成產(chǎn)品、怎么控制成本、怎么在供應(yīng)鏈里活下來(lái)。陳天潤(rùn)的經(jīng)歷和經(jīng)驗(yàn)值得被挖掘,于是有了這次對(duì)話(huà)。

以下是陳天潤(rùn)與 AI 科技評(píng)論的對(duì)話(huà),AI 科技評(píng)論作了不改變?cè)獾木庉嫞?/p>

造小家電的過(guò)程中,意外發(fā)現(xiàn)了空間智能的 Scaling Law

AI 科技評(píng)論:外界對(duì)魔芯科技的認(rèn)知還停留在 3D 打印機(jī),你們這次突然宣布拿到億元融資,是因?yàn)槭裁矗?/p>

陳天潤(rùn):我們之前 3D 打印機(jī)做得不錯(cuò),在持續(xù)研發(fā)與研究的過(guò)程中,洞察到了空間智能的 Scaling Law(規(guī)模定律),看到了一條走向高泛化、高通用、可交互、高精度世界模型的路徑。

AI 科技評(píng)論:這項(xiàng)研究成果是什么時(shí)候發(fā)現(xiàn)的?

陳天潤(rùn):2024 年底,我們?cè)谘芯?3D AI 建模時(shí),測(cè)試某個(gè)網(wǎng)絡(luò)結(jié)構(gòu),發(fā)現(xiàn)它不僅能把物體生成得很好,空間也能做。而且數(shù)據(jù)喂得越多,空間重建效果越好,精度和一致性都更好。

這讓我們意識(shí)到:空間建??赡艽嬖谀撤N Scaling Law。就像大語(yǔ)言模型直到 ChatGPT 才證明 " 數(shù)據(jù)越多效果越好 ",在 3D 領(lǐng)域,過(guò)去大家先構(gòu)建中間表示,也就是類(lèi)似知識(shí)圖譜的東西,再生成結(jié)果。比如李飛飛的 World Labs 等,會(huì)選擇先構(gòu)建全景圖或者先建 3D 高斯,再用這個(gè)去做下游任務(wù)。但我們發(fā)現(xiàn),如果去掉這個(gè)中間環(huán)節(jié),直接端到端訓(xùn)練,模型反而學(xué)得更好。

AI 科技評(píng)論:是什么數(shù)據(jù)在驅(qū)動(dòng)這個(gè)意外發(fā)現(xiàn)?

陳天潤(rùn):3D 原生數(shù)據(jù),比如圖片與 3D 信息的配對(duì),加上文本描述。我們有個(gè)數(shù)據(jù)團(tuán)隊(duì)在專(zhuān)門(mén)采集,雇了大量人員在采數(shù)據(jù),就跟很多機(jī)器人公司雇人采數(shù)據(jù)一樣。

AI 科技評(píng)論:意思是合成數(shù)據(jù)和真實(shí)數(shù)據(jù)都用,那比例呢?

陳天潤(rùn):這里有個(gè) " 配方 " 問(wèn)題。真實(shí)數(shù)據(jù)提供泛化性,但它不準(zhǔn);合成數(shù)據(jù)準(zhǔn),但不泛化,遇到新場(chǎng)景就得改。我們得像廚師一樣調(diào)配這個(gè)比例,不同訓(xùn)練階段配方還不一樣。

AI 科技評(píng)論:輸血業(yè)務(wù)一會(huì)聊,先說(shuō)說(shuō)數(shù)據(jù)采集成本吧,不少投資人關(guān)注這個(gè)話(huà)題。

陳天潤(rùn):中國(guó)在這方面有成本優(yōu)勢(shì)。并且這跟具身智能公司采的數(shù)據(jù)不完全一樣,有重疊部分,也有我們獨(dú)特的部分。因?yàn)樽罱K要服務(wù)具身智能場(chǎng)景,所以也會(huì)采那些機(jī)器人需要的數(shù)據(jù)。

AI 科技評(píng)論:你們的世界模型,和市面上其他方案有什么區(qū)別?

陳天潤(rùn):我們是國(guó)內(nèi)首個(gè)基于全國(guó)產(chǎn)算力(華為昇騰 910C)的數(shù)分鐘級(jí)交互式世界模型 KOKONI-World。很多行業(yè)頭部公司的架構(gòu),會(huì)出現(xiàn)數(shù)據(jù)喂多效果未必更好的情況。但我們的架構(gòu)是端到端的,數(shù)據(jù)規(guī)模上去后,空間理解能力會(huì)持續(xù)提升。

更重要的是模型的可部署性?,F(xiàn)在大部分世界模型跑實(shí)時(shí)視頻生成需要 10 張 A100,不可能上到車(chē)端。我們能在端側(cè) NPU(比如瑞芯微、地平線(xiàn)芯片)上跑,模型規(guī)模壓縮到 1-2B,不需要背個(gè) 4090 顯卡在機(jī)器人身上——有些公司宣稱(chēng)端側(cè)部署,結(jié)果卻是背張顯卡。

空間智能的戰(zhàn)場(chǎng),在科研也在產(chǎn)業(yè)

AI 科技評(píng)論:端側(cè) VLA 的商業(yè)場(chǎng)景是什么?

陳天潤(rùn):兩條線(xiàn)。一是具身智能,每個(gè)和真實(shí)世界交互的終端都應(yīng)該具備空間智能的感知和理解能力,這個(gè)目的是讓機(jī)器人 " 看得懂也走得準(zhǔn) "。

二是自動(dòng)駕駛,我們正在跟一些廠商合作,最晚明年就能有我們的模型批量部署。現(xiàn)在的世界模型大多被當(dāng)成 " 數(shù)據(jù)生成器 " 用,因?yàn)榕艿锰?。我們能?shí)時(shí)跑,就可以直接集成到在線(xiàn)系統(tǒng)里——邊感知、邊推理、邊決策。這是我們覺(jué)得非常適合世界模型的應(yīng)用場(chǎng)景。

AI 科技評(píng)論:車(chē)企怎么評(píng)價(jià)你們的技術(shù)?他們之前用的都是大算力芯片方案。

陳天潤(rùn):我有個(gè)觀察,大算力芯片在車(chē)上永遠(yuǎn)有局限。單顆芯片再大,也搞不定 10 張 A100 的算力需求。我們的方案是在端側(cè)用相對(duì)不錯(cuò)的 NPU,讓模型能夠給現(xiàn)有的系統(tǒng)帶來(lái) " 增加一個(gè)傳感器 " 一樣的增益。

" 消費(fèi)電子的創(chuàng)業(yè)經(jīng)歷,教會(huì)我們什么叫效率 "

AI 科技評(píng)論:你們從 3D 打印轉(zhuǎn)型,團(tuán)隊(duì)架構(gòu)怎么調(diào)整?

陳天潤(rùn):打印機(jī)業(yè)務(wù)我們還在做,市場(chǎng)快速增長(zhǎng),但對(duì)于我們的轉(zhuǎn)型來(lái)說(shuō)重要性下降了。但消費(fèi)電子產(chǎn)品的研發(fā)、生產(chǎn)制造等經(jīng)驗(yàn),對(duì)現(xiàn)在特別有幫助。

AI 公司很少有干過(guò)消費(fèi)電子的,那是個(gè)卷得要命的行業(yè)——成本控制、流程控制、項(xiàng)目進(jìn)度控制、生產(chǎn)進(jìn)度控制,全有講究。我們被卷了五年,組織效率被 " 卷 " 出來(lái)了。現(xiàn)在做世界模型,也用這套方法論:快速迭代、質(zhì)量控制、工程落地,這也顯得我們和其他 AI 公司不一樣的基因和效率。

AI 科技評(píng)論:具體怎么體現(xiàn)這種效率優(yōu)勢(shì)?

陳天潤(rùn):如果從科研直接下場(chǎng),那團(tuán)隊(duì)就沒(méi)經(jīng)歷過(guò)殘酷的商業(yè)拷打。我們經(jīng)歷過(guò):2022 年就在小米渠道賣(mài) 3D 打印機(jī),眾籌 600 多萬(wàn),但友商出來(lái)后,一切變了——他們研發(fā)投入帶來(lái)的產(chǎn)品代差,直接把市場(chǎng)卷飛了。

這種 " 被卷過(guò) " 的經(jīng)歷,讓我知道什么叫真正的商業(yè)化閉環(huán)?,F(xiàn)在來(lái)做 AI 賽道,如果手里沒(méi)業(yè)務(wù),我會(huì)很慌。我覺(jué)得 AI 或者說(shuō)世界模型這個(gè)領(lǐng)域還是離不開(kāi)基本商業(yè)邏輯,公司的業(yè)務(wù)可以設(shè)置和投資人溝通的 " 市場(chǎng)部 ",也可以留出學(xué)術(shù)探索空間,但無(wú)論如何,要保證在產(chǎn)業(yè)里干活,才會(huì)讓我感到踏實(shí)。

AI 科技評(píng)論:拓竹屬于行業(yè)中的 " 卷王 "?

陳天潤(rùn):拓竹做出了足夠好的產(chǎn)品,就像戴森用核心技術(shù)構(gòu)建了壁壘,聰明的中國(guó)人后面會(huì)火速跟進(jìn),但第一波沖擊扛不住。

AI 科技評(píng)論:你們可以做 " 徠芬 " 啊。

陳天潤(rùn): 我們一度是 3D 打印領(lǐng)域的 " 徠芬 "(國(guó)產(chǎn)吹風(fēng)機(jī)品牌),更卷的那種。我現(xiàn)在保留了 3D 打印機(jī)的業(yè)務(wù)。但更重要的是,我們?cè)谧?" 高速吹風(fēng)機(jī) " 的過(guò)程中,發(fā)現(xiàn)了怎么造 " 行星發(fā)動(dòng)機(jī) "(高速電機(jī)的核心研發(fā)配件,編者注)

AI 科技評(píng)論:打印機(jī)業(yè)務(wù)還在公司內(nèi)部嗎?(雷峰網(wǎng))

陳天潤(rùn):現(xiàn)金流業(yè)務(wù),我們?nèi)匀辉跒榭蛻?hù)提供更多更具性?xún)r(jià)比的 3D 打印機(jī)選擇。

" 一秒鐘一毛錢(qián) " 的商業(yè)化邏輯

AI 科技評(píng)論:你說(shuō)你們現(xiàn)在有不少影視娛樂(lè)的業(yè)務(wù),這和你說(shuō)的 " 主航道是世界模型 " 似乎有落差。

陳天潤(rùn):世界模型是基座、是能力,影視娛樂(lè)只是實(shí)際應(yīng)用的一種。影視娛樂(lè)是 " 殺雞用牛刀 ",但能快速驗(yàn)證模型能力、產(chǎn)生現(xiàn)金流。我們把古畫(huà)變 3D、做 AI 短劇、文旅項(xiàng)目的沉浸式體驗(yàn),一秒鐘視頻成本不到一毛錢(qián),一分鐘也就六塊錢(qián),傳統(tǒng)影視特效做不到這個(gè)價(jià)。

AI 科技評(píng)論:為什么這么便宜?

陳天潤(rùn):因?yàn)榭臻g模型將推理步驟在空間中而不是在語(yǔ)言模型中完成,架構(gòu)的特性導(dǎo)致算力消耗?。涣硗庠趪?guó)產(chǎn)信創(chuàng)的趨勢(shì)下,3D 渲染、機(jī)器人仿真,我們有可以交付的方案。

AI 科技評(píng)論:還有其他應(yīng)用嗎?(雷峰網(wǎng))

陳天潤(rùn):今年晚些時(shí)候會(huì)有手機(jī)終端發(fā)布我們的功能。我們真正的想象力在更大的場(chǎng)景:讓空間智能成為基礎(chǔ)設(shè)施,就像 DeepSeek 是通用基座,上面可以長(zhǎng)出醫(yī)療大模型、政務(wù)大模型。我們的基座能長(zhǎng)出端側(cè) VLA、自動(dòng)駕駛感知、實(shí)時(shí) 3D 重建各種應(yīng)用。

AI 科技評(píng)論:但你之前說(shuō)具身智能和自動(dòng)駕駛都還沒(méi)真正落地。

陳天潤(rùn):對(duì),所以我們現(xiàn)在一邊瘋狂 Scaling 基礎(chǔ)模型,一邊用娛樂(lè)應(yīng)用養(yǎng)現(xiàn)金流。樂(lè)觀地看,在今明兩年的時(shí)間就會(huì)有我們的空間模型算法在具身和智駕系統(tǒng)中落地。

AI 科技評(píng)論:2026 年世界模型會(huì)迎來(lái) "GPT 時(shí)刻 " 嗎?

陳天潤(rùn):學(xué)術(shù)研究會(huì)持續(xù)推進(jìn),產(chǎn)業(yè)落地我不確定。對(duì)我們來(lái)說(shuō),會(huì)盡快讓更多場(chǎng)景用上我們的模型能力,不管是早期的娛樂(lè)應(yīng)用,還是終局的具身智能、自動(dòng)駕駛。

學(xué)術(shù)還是得跟實(shí)際產(chǎn)業(yè)結(jié)合,不能空中樓閣。 這是我們和很多 AI 公司的區(qū)別:我們有打印機(jī)業(yè)務(wù)練出來(lái)的商業(yè)化能力,知道怎么控制成本、怎么量產(chǎn)、怎么在消費(fèi)電子的修羅場(chǎng)里活下來(lái)。這種 " 被卷過(guò) " 的經(jīng)歷,現(xiàn)在反而成了優(yōu)勢(shì)。

一位 00 后 CEO 眼里的行業(yè)現(xiàn)狀

AI 科技評(píng)論:你怎么評(píng)價(jià)現(xiàn)在具身智能領(lǐng)域的創(chuàng)業(yè)熱潮?

陳天潤(rùn):熱鬧。 很多公司堆估值、堆融資。

AI 科技評(píng)論:怎么看國(guó)內(nèi)世界模型賽道的競(jìng)爭(zhēng)格局?

陳天潤(rùn):我感覺(jué)中美在這個(gè)賽道,有個(gè)明顯的區(qū)別,美國(guó)那邊,投資人愿意花錢(qián)買(mǎi)一張 " 通往 AGI 的門(mén)票 "。

國(guó)內(nèi)大家更保守,更愿意等類(lèi)似大模型里的 "GPT 時(shí)刻 " 這樣的確定路徑出現(xiàn),但現(xiàn)在世界模型的 "Transformer" 還沒(méi)出現(xiàn),所以大家都在觀望。我們?cè)诏偪?Scaling,手上的資源和數(shù)據(jù)都在加碼,無(wú)論如何,我們?cè)敢鈬L試。

AI 科技評(píng)論:如果英偉達(dá)明天開(kāi)源一個(gè)更強(qiáng)悍的世界模型,你們?cè)趺崔k?

陳天潤(rùn):垂直場(chǎng)景深耕。 我們有他們不具備的優(yōu)勢(shì):全國(guó)產(chǎn)算力適配、端側(cè)部署能力、消費(fèi)電子的工程化經(jīng)驗(yàn)。Cosmos 很好,但它跑在英偉達(dá)卡上,在中國(guó)車(chē)企那里未必好用。我們可以做 " 中國(guó)版 Cosmos",并且這部分我們已經(jīng)在做了,近期工作會(huì)開(kāi)源。

相關(guān)標(biāo)簽

相關(guān)閱讀

最新評(píng)論

沒(méi)有更多評(píng)論了
雷峰網(wǎng)

雷峰網(wǎng)

讀懂智能&未來(lái)

訂閱

覺(jué)得文章不錯(cuò),微信掃描分享好友

掃碼分享

企業(yè)資訊

查看更多內(nèi)容