电竞比分网-中国电竞赛事及体育赛事平台

關于ZAKER 合作

國產(chǎn)芯片錯過「組團反殺」英偉達機會,或因死磕自研互聯(lián)協(xié)議

" 超節(jié)點互聯(lián)協(xié)議生態(tài)的碎片化,正成為制約其規(guī)模化部署的核心瓶頸。"奇異摩爾 CEO 田陌晨說。

從當前產(chǎn)業(yè)實踐來看,全球已形成多條技術路線并行競爭的格局:英偉達 NVLink 憑借成熟生態(tài)與全棧封閉體系占據(jù)高端訓練主導地位;華為靈衢依托超節(jié)點架構在國內(nèi)智算中心實現(xiàn)規(guī)?;渴?;UALink 聯(lián)盟以開放標準為基礎,打造多廠商兼容的開放互聯(lián)協(xié)議,形成 " 反英偉達 " 聯(lián)盟;ETH X、SUE 等以太網(wǎng)開放協(xié)議,以及 OISA 標準,在通用物理層之上構建原生超節(jié)點互聯(lián)協(xié)議,兼顧開放生態(tài)與部署成本。

路線的差異客觀上構成了彼此割裂的生態(tài)孤島,設備互操作性受限,客戶一旦選定某條路線便深陷遷移成本高昂的 " 單選題 " 困境。

" 英偉達新一代 DGX SuperPOD 統(tǒng)一內(nèi)存域的規(guī)模上限為 576 個 Rubin GPU,核心原因正是其多層異構的互聯(lián)架構:GPU 與 CPU 之間采用 NVLink 或 PCIe、GPU 與 GPU 之間采用 NVLink,而跨服務器互聯(lián)則采用 InfiniBand 或以太網(wǎng)。" 資深產(chǎn)業(yè)專家劉雨嫣表示," 不同層次的計算資源采用不同協(xié)議互聯(lián),會直接推高集群維護成本,同時削弱網(wǎng)絡彈性。"

不過這一困境并未動搖國內(nèi)廠商自研的路徑,不少廠商相繼推出采用自研互聯(lián)協(xié)議的超節(jié)點方案。

" 但這類企業(yè)普遍缺乏 chip-to-chip 片間互聯(lián)技術的積累,而算力體系向 scale-up 深度演進的過程中,對網(wǎng)絡能力與系統(tǒng)架構的要求卻會持續(xù)抬升。網(wǎng)絡研發(fā)的技術難度并不亞于高端芯片設計,且至少需要 500 人的團隊規(guī)模才能支撐。"芯片廠商高管張翔評價道。關于國產(chǎn)芯片廠商在超節(jié)點領域的競爭態(tài)勢,歡迎添加微信 YONGGANLL6662 交流更多信息。

各家單打獨斗,本質是出于搶占生態(tài)話語權、構建技術壁壘等考量,但這一做法無疑加劇了協(xié)議生態(tài)的碎片化。行業(yè)更主流的共識,指向了另一條更關鍵的路徑:協(xié)議標準化。

歷史規(guī)律反復驗證:協(xié)議標準化是技術規(guī)模化爆發(fā)的先決條件。TCP/IP 奠定了萬維網(wǎng),4G LTE 收斂催生了移動互聯(lián)網(wǎng)。超節(jié)點互聯(lián)亦然,只有通過開放統(tǒng)一的互聯(lián)協(xié)議,實現(xiàn)算力硬件的全域互通與高效協(xié)同,才能真正支撐起下一代 AI 算力基礎設施。

那么,既然開放是大勢所趨,為何頭部廠商仍堅持以封閉協(xié)議構筑壁壘?在標準割據(jù)與生態(tài)壟斷的夾縫中,中小芯片廠商是否還有破局空間?這場關乎未來算力格局的技術博弈,最終是否真的會像互聯(lián)網(wǎng)一樣,走向協(xié)議統(tǒng)一與全域互通?

封閉協(xié)議催生生態(tài)「排他性」,谷歌與英偉達會就此「贏家通吃」嗎?

" 互聯(lián)標準不統(tǒng)一、生態(tài)割裂,是當前的必然結果。谷歌和英偉達在設計超節(jié)點互聯(lián)架構之初,就沒有以開放兼容為目標。它們不會等待行業(yè)形成共識,而是持續(xù)迭代新標準,以此保持技術領先身位。" 通信芯片專家李南指出。

多位行業(yè)人士也認為,超節(jié)點整體仍處于極早期階段。它的出現(xiàn),本質源于云計算架構從通算向智算轉型,這一變化要求云計算體系必須圍繞 AI 范式進行全面重構。

" 在當下全面重構的階段,互聯(lián)協(xié)議是突破超節(jié)點‘通信墻’這一核心瓶頸的關鍵所在,因此各大巨頭正通過封閉化的技術路線,快速構筑屬于自己的底層壁壘,所以這個階段追求協(xié)議統(tǒng)一并不現(xiàn)實。" 劉雨嫣說。

谷歌為 TPU 集群量身打造了封閉式芯片間高速互聯(lián)協(xié)議 ICI(Inter-Chip Interconnect),并將其與 OCS 光電路交換、以太網(wǎng)交換機、專用光模塊以及 TPU 深度協(xié)同,實現(xiàn)了極高的產(chǎn)品解決方案一致性,依據(jù)需求構建了 " 蘋果式生態(tài) "。" 這種情況下他們一定是實現(xiàn)效果最佳的,Gemini 3 的成功便是最有力的說明。"李南評價道。

英偉達則從底層硬件出發(fā),自下而上構建超節(jié)點解決方案。其以 NVLink 為核心的私有互聯(lián)技術,提供了遠超傳統(tǒng)以太網(wǎng)的帶寬與通信效率,讓多芯片以極低時延實現(xiàn)高效協(xié)同調度,并且靠著在單芯片設計能力上的壟斷地位,其在市場上同樣極具聲量。

" 但英偉達需要兼顧原有技術體系的兼容性與繼承性,短期內(nèi)其超節(jié)點規(guī)模僅能支持到 576 顆芯片。而云廠商身處激烈的 MaaS 競爭,提供 Token 服務必須原生支持超大規(guī)模集群調度,面向的是百萬卡級別的組網(wǎng)能力,這種路線差異最終帶來了雙方產(chǎn)品形態(tài)的分化。" 芯片專家子皓表示。

不過,業(yè)內(nèi)普遍認為,二者只是技術優(yōu)先級與演進路徑不同,本質差異并不大。英偉達后續(xù)同樣具備支撐百萬卡級規(guī)模的能力,這就意味著英偉達和谷歌一樣,都將具備強大的規(guī)模化部署能力。

所以,為了充分利用封閉自研協(xié)議的優(yōu)勢,英偉達及谷歌都定義統(tǒng)一、標準化的原子節(jié)點。通過讓每一個最小算力單元形態(tài)、接口、性能保持一致,實現(xiàn)大規(guī)模的高效組網(wǎng)。

規(guī)?;渴鹉軌驇順O強的 " 排他性 ",進一步強化了英偉達及谷歌的壟斷地位。

子皓向雷峰網(wǎng)表示:"AI 云是贏家通吃的市場,一旦錯失先機,很可能徹底被邊緣化。而封閉的互聯(lián)協(xié)議,正是當前英偉達和谷歌重要的競爭手段,甚至可以說是最優(yōu)選擇。"

那么,面對英偉達和谷歌強大的競爭壁壘,超節(jié)點這場游戲是否還有新玩家的席位?

國產(chǎn)超節(jié)點陷阱:500 人團隊死磕自研協(xié)議,不如接入開放生態(tài)

" 對絕大多數(shù)芯片廠商而言,超節(jié)點賽道已明顯超出其能力邊界。這類企業(yè)普遍缺乏 chip-to-chip 互聯(lián)技術的積累,而算力體系向 scale-up 深度演進的過程中,對網(wǎng)絡能力與系統(tǒng)架構的要求卻會持續(xù)抬升。" 張翔表示," 網(wǎng)絡研發(fā)的技術難度并不亞于高端芯片設計,且至少需要 500 人的團隊規(guī)模才能支撐。"

與此同時,對于單純聚焦超節(jié)點系統(tǒng)解決方案的廠商而言,同樣面臨難以破解的行業(yè)困境:超節(jié)點的技術話語權與生態(tài)落地,高度依賴行業(yè)巨頭帶頭并定義標準,獨立方案商很難憑借自身力量建立事實標準,但被動跟隨、適配巨頭標準,又會在產(chǎn)業(yè)鏈中失去不可替代性。

在標準話語權缺失、自研投入性價比較低的多重約束下,對不少廠商而言,過度追求互聯(lián)協(xié)議自主權,反而容易變成不切實際的 " 內(nèi)耗 ",并進一步加劇互聯(lián)協(xié)議生態(tài)的割裂。而放棄協(xié)議自研,是否就等于放棄生態(tài)話語權?歡迎添加微信 YONGGANLL6662 交流這一行業(yè)矛盾。

芯片公司和 OEM 的合作是一個破局的思路,寒武紀與中興通訊的合作提供了一個 " 分工解耦 " 的例子,前者專注 MLU-Link 芯片級互聯(lián),后者發(fā)揮系統(tǒng)級工程化優(yōu)勢,雙方通過協(xié)議適配完成超節(jié)點落地。華為開放靈衢 2.0 協(xié)議,為第三方芯片廠商提供高速互聯(lián)能力,支持超節(jié)點集群的多卡擴展。中國移動 OISA 等開放聯(lián)盟同樣破解標準割裂,走 " 國芯國連、協(xié)議共用 " 的開放路線。

此外,在超節(jié)點的產(chǎn)品形態(tài)下,采用統(tǒng)一開放的互聯(lián)協(xié)議正為中小芯片廠商對抗谷歌、英偉達的封閉生態(tài)提供了歷史性契機。

趨境科技架構師謝威宇向雷峰網(wǎng)表示:" 國產(chǎn)算力硬件廠商當下不應走封閉路線,在英偉達和谷歌的體系中,異構會帶來效率損耗,但對中小廠商而言,超節(jié)點則提供了異構的契機,其通信與計算并非強耦合,所以統(tǒng)一的通信層為產(chǎn)業(yè)協(xié)同創(chuàng)造了條件。英偉達之外芯片廠商間的合作,能在全球競爭中占據(jù)更大的市場份額。"

不少業(yè)內(nèi)人士也表示:統(tǒng)一協(xié)議帶來高效互聯(lián)的情境下,異構集群效率會更高。大模型推理等任務結構復雜,不同模塊天然適配不同芯片,強行同構反而會抹銷場景化適配帶來的性能收益。

" 當前,PD 分離已是成熟且易于落地的拆分方案。未來還可向更細粒度延伸,例如在模型內(nèi)部實現(xiàn) Attention 與 MoE、稠密計算與稀疏計算的分離,讓更匹配的計算硬件承接更細分的任務,會有更高效率。" 謝威宇表示。

行業(yè)共識也并非只有 " 兼容開放 " 一條路徑:擁抱開放協(xié)議是務實選擇,而為適配自身優(yōu)勢場景,走向適度的協(xié)議自主化,同樣是國產(chǎn)算力廠商值得探索的可行方向。

這種場景化自主,建立在對超節(jié)點最優(yōu)規(guī)模的判斷之上。對部分芯片廠商而言,其真正的優(yōu)勢區(qū)間也較為明確:面向中小型模型推理集中在 16 – 64 卡,萬億參數(shù)大模型則在 128 – 256 卡。

" 過度追求超節(jié)點規(guī)模,一旦超出閾值,通信延遲增長會抵消算力提升,導致 GPU 閑置率上升、故障率急劇攀升,MFU 也會大幅下降。聚焦優(yōu)勢場景與成本優(yōu)化,通過低精度算力與互聯(lián)協(xié)議深度優(yōu)化,才能有效降低單 Token 成本,遠比盲目擴集群規(guī)模更具競爭力。" 曦望 Sunrise 聯(lián)席 CEO 王勇表示。

NVLink 終將「安卓化」?CSP 對封閉協(xié)議沒有 " 容忍度 "

超節(jié)點互聯(lián)協(xié)議生態(tài)的 " 開放 " 與 " 封閉 " 之爭,是 AI 基礎設施產(chǎn)業(yè)極具張力的敘事主線。這場博弈不僅關乎技術路線的勝負,更將決定下一代算力基礎設施的權力分配格局。

" 當超節(jié)點演進為全行業(yè)的技術焦點,其規(guī)模效應與性能需求將自下而上驅動當前碎片化的網(wǎng)絡互聯(lián)協(xié)議生態(tài)向收斂態(tài)演進。這一過程有望推動資源與研發(fā)力量向統(tǒng)一的開放協(xié)議體系匯聚,最終構建出支撐下一代數(shù)字基礎設施發(fā)展的、具有廣泛互操作性的標準協(xié)議框架與生態(tài)系統(tǒng)。" 田陌晨表示。

SUE、OISA、ETH-X、UALink 等協(xié)議的涌現(xiàn),正逐步推動開放互連生態(tài)的構建。

然而,這一收斂進程注定不會一蹴而就。

超節(jié)點互聯(lián)協(xié)議碎片化是一個復雜命題,僅憑單一企業(yè)的力量難以進行統(tǒng)籌,這是一場關乎 " 生態(tài)構建 " 與 " 產(chǎn)業(yè)協(xié)同 " 的系統(tǒng)性工程,其成功高度依賴于產(chǎn)業(yè)鏈上下游的緊密協(xié)作。

因此,市場力量也將成為打破封閉格局的關鍵推力。

"CSP(云服務提供商)企業(yè)與大客戶對封閉協(xié)議的容忍度會逐漸逼近臨界點,其推動協(xié)議開放的訴求日益強烈。英偉達雖然通過 NVLink 和 InfiniBand 能構建起技術壁壘,但面對這種行業(yè)壓力,開放協(xié)議是遲早的事情。"劉雨嫣表示。

事實上,英偉達已于 2025 年 5 月推出 NVLink Fusion,將封閉的 NVLink 高速互聯(lián)技術開放為可集成第三方芯片的半定制架構,但主要面向云廠商等客戶及合作伙伴,且有嚴格準入與合規(guī)門檻。

總體看來,封閉與開放的博弈本質上是產(chǎn)業(yè)發(fā)展階段的映射。

谷歌 ICI、英偉達 NVLink 等垂直整合方案,皆是特定歷史階段的產(chǎn)物:先以封閉體系快速滿足市場需求、初步確立工業(yè)標準,再通過行業(yè)協(xié)會漸進式推動協(xié)議統(tǒng)一,最終交由 UEC 等產(chǎn)業(yè)組織落地實現(xiàn),這一路徑在 IT 產(chǎn)業(yè)發(fā)展史上屢見不鮮。

互聯(lián)網(wǎng)的發(fā)展歷程為此提供了最有力的參照。

無論是 WLAN、以太網(wǎng)、5G 等不同底層接入方式,還是手機、電腦等各類終端,彼此之間的通信都統(tǒng)一基于 IP 協(xié)議承載。正是憑借這套全球通用的協(xié)議體系,互聯(lián)網(wǎng)才打破了早期各類私有通信協(xié)議的壁壘,實現(xiàn)全域互通。

這一邏輯同樣適用于當前的 AI 算力基礎設施。

采用開放統(tǒng)一的超節(jié)點互聯(lián)協(xié)議,能夠讓算力硬件全域互通、高效協(xié)同,以此支撐起爆發(fā)式增長的算力需求。

循此邏輯,面向國產(chǎn)超節(jié)點互聯(lián)的未來發(fā)展,更可行的路徑已然清晰:由國內(nèi)大型云服務商與頭部廠商協(xié)同,在工信部指導下,共同制定統(tǒng)一的中國國家標準。回顧過去幾十年的技術演進,PON 接入、TD-LTE 等重大技術體系均走過類似道路,以頂層引導與產(chǎn)業(yè)協(xié)同的方式,形成自主可控、規(guī)模化落地的技術標準體系。

作者長期關注 AI 芯片、存儲領域,歡迎添加微信 YONGGANLL6662 交流更多行業(yè)信息。

注:文中張翔、李南、子皓皆為化名。

相關標簽

相關閱讀

最新評論

沒有更多評論了
雷峰網(wǎng)

雷峰網(wǎng)

讀懂智能&未來

訂閱

覺得文章不錯,微信掃描分享好友

掃碼分享

企業(yè)資訊

查看更多內(nèi)容