电竞比分网-中国电竞赛事及体育赛事平台

關(guān)于ZAKER Skills 合作
硅星人 15小時前

40 年來第一次:PC 被 NVIDIA 和微軟重新發(fā)明了

2026 年 6 月 1 日,黃仁勛(Jensen Huang)在 NVIDIA GTC Taipei 2026 主題演講,同步連線全臺 70 個分會場,并為 Computex 揭幕。在這場近 2 小時的演講里,他拋出了一個足以改寫整個消費電子格局的判斷——"40 年來 PC 的第一次重新發(fā)明,由 NVIDIA 和 Microsoft 聯(lián)手完成。"

這是本場大會真正的核心亮點:NVIDIA 要造 PC 了,而且不是配角,是主角。 黃仁勛的邏輯鏈很清晰:既然未來十年的統(tǒng)一計算模式是 Agent(模型 + Harness + 工具 + Runtime),那么 Agent 不僅要跑在云端,也必須原生跑在每個人的 PC 上——能 7×24 小時不間斷、本地沙箱化、連接本地或云端模型、看得見你、聽得懂你、替你干活。為此,PC 的芯片和操作系統(tǒng)都得重做。

黃仁勛親口透露,NVIDIA 和 Microsoft 用了整整三年時間,從零重構(gòu) PC 的運作方式,就為了等這個 Agent 時刻。

他類比 40 年前 Windows 之所以讓 PC 走進千家萬戶,是因為做對了幾件事:BIOS 抽象、開放芯片組、運行時可加載驅(qū)動、多媒體 API 抽象層。今天 Microsoft 和 NVIDIA 要再做一次同樣的事:新一代 PC = 舊操作系統(tǒng) + 大語言模型 + Agent Runtime。

次日晚黃仁勛還將與 Satya Nadella 同臺進一步披露細節(jié)。這意味著 Windows 不再只是"運行應用的操作系統(tǒng)",而是"運行 Agent 的操作系統(tǒng)",而 NVIDIA,是這套新 OS 底層硬件的聯(lián)合定義者。

以下為實錄

一、有用的 AI 已經(jīng)到來

兩年前的演講談到 AI 正從生成式 AI 向更多浪潮演進,而下一波是智能體 AI(agentic AI)。今天可以宣告:智能體 AI 已經(jīng)到來,有用的 AI 已經(jīng)到來。

以 GitHub 為例。軟件編程是智能體 AI 最早的應用之一,也是最有價值的職業(yè)之一——全球約有 3000 萬至 4000 萬靠寫代碼為生的專業(yè)軟件開發(fā)者,另有數(shù)億學生與愛好者。在 GitHub 上,pull request 指下載并修改軟件,commit 指將改動推送回去。代碼提交量從 2023 年的 3 億次、2024 年的 4 億次增長到 2025 年的 5 億次,而到 2026 年頭幾個月已接近翻三倍。

這意味著什么?3000 萬軟件開發(fā)者對應約 3 萬億美元的年薪酬,而這些薪酬撬動著其他行業(yè)的經(jīng)濟增長——全球約 100 萬億美元的各行各業(yè)都受其影響。如今這 3 萬億美元的薪酬正產(chǎn)出接近三倍的成果,相當于用 3 萬億美元的工資帶來了 9 萬億美元的生產(chǎn)力,差距極其驚人。

軟件工程師的數(shù)量其實在增加,而非減少。邏輯很簡單:如果雇一名工程師能產(chǎn)出價值 9 萬億美元的有效工作,企業(yè)自然會想雇更多人;只有當產(chǎn)出持平時,雇用才會減少。正因產(chǎn)出驚人,需求才上升,這一點很快會反映到經(jīng)濟數(shù)據(jù)中。

從產(chǎn)業(yè)角度看,有用的 AI 到來意味著 token 需求高漲。token 如今是能帶來收入的盈利單位,因此 AI 公司想生成更多 token、建更多 AI 工廠——這正是中國臺灣算力需求飆升、相關(guān)企業(yè)業(yè)務繁忙的原因。

二、新的計算范式:智能體(agent)

計算范式已經(jīng)改變。AI 現(xiàn)在是利潤與 GDP 的生成器,其背后是一種全新的計算范式——不只是一個大語言模型,而是一個智能體。

在過去,軟件是運行在操作系統(tǒng)之上的應用程序與代碼。今天則是智能體:由一個或多個大語言模型構(gòu)成,置于一個"載體框架"(harness)之中,由后者協(xié)調(diào)編排其工作。輸入進入后,智能體需要理解、觀察、推理、行動并使用工具——工具可以是電子表格、瀏覽器、數(shù)據(jù)處理引擎或數(shù)據(jù)庫引擎。整個信息流轉(zhuǎn)的編排由軟件管理。智能體同樣要處理短期記憶(工作記憶)與長期記憶,因此記憶管理系統(tǒng)至關(guān)重要??梢园汛笳Z言模型視為負責思考的部分,把載體視為像操作系統(tǒng)一樣把一切連接起來的部分。

這一突破源于兩件事的同時收斂:大語言模型已能勝任思考、推理、規(guī)劃與工具使用;同時出現(xiàn)了能管理記憶、編排與工具調(diào)用的載體。兩者結(jié)合后能力驚人。例如給定一段提示詞即可生成可運行的代碼;輸入"生成一個 GIF:黑底上的 NVIDIA 綠色圓點散開、組成臺北 101、顯示 NVLink GTC Taipei 2026、變形為 NVIDIA 標志后再散開循環(huán)"即可得到成品;輸入"我弄丟了遙控器的電池卡扣,它長這樣,幫我做一個 CAD 文件",智能體會調(diào)用工具生成可直接 3D 打印的 CAD 文件。這里使用的是 Claude Code,Codex 同樣表現(xiàn)出色。

新范式由此成形:過去是啟動應用、點擊與打字,如今是向 AI 說明意圖,由 AI 生成代碼或調(diào)用工具產(chǎn)出結(jié)果。這就是未來計算機的工作方式。

關(guān)于"智能體會讓軟件公司消失"的擔憂,結(jié)論恰恰相反。智能體數(shù)量將不再受人口限制,因此會比以往更頻繁地使用工具,對軟件公司而言是絕佳時代——前提是軟件須以智能體可用的方式呈現(xiàn)。NVIDIA 的核心資產(chǎn)正是其全部 CUDA 庫(即 CUDA-X 庫),如今可呈現(xiàn)給智能體使用,效率甚至高于人類。

(視頻旁白)20 年前 NVIDIA 打造了 CUDA 這一加速計算的統(tǒng)一架構(gòu),重新發(fā)明了計算。上千個 CUDA-X 庫幫助開發(fā)者在各科學與工程領(lǐng)域取得突破,它們本身就是智能體的工具:cuLitho 用于計算光刻,cuOpt 用于決策優(yōu)化,cuDSS 用于直接稀疏求解,AI-Q 用于跨結(jié)構(gòu)化與非結(jié)構(gòu)化文檔的深度研究,Aerial 用于 AI RAN,PhysicsNeMo 用于可微分物理,Parabricks 用于基因組學。

三、智能體的分布式計算與 Vera Rubin

智能體是終極的解耦(disaggregated)與分布式計算模型,處理它需要調(diào)動數(shù)據(jù)中心中大量不同的計算機。智能體由模型、載體、工具與技能、運行時(runtime)組成:模型是大腦,載體是身體,工具則像工人在工作坊中使用的器具。

各步驟運行在計算機的不同部分:大語言模型負責思考——處理上下文、觀察環(huán)境、推理、制定并執(zhí)行計劃,每次思考都會激活一整個機架的 Grace Blackwell NVLink 72;每次使用工具會用到 CPU(工具可以是 C 編譯器、Python、JavaScript 或加速計算)。今天的智能體還只是較簡單的工具使用者,未來會變得極其老練,因此 CUDA-X 庫將大受歡迎,而這些庫現(xiàn)在都會附帶"技能"說明,讓 AI 讀后即可學會使用。

在這一模型中,工具運行于 CPU、GPU 與大語言模型之上;安全載體運行于 CPU 與安全處理器 DPU(NVIDIA BlueField)之上;整體編排運行于 CPU。最難的部分之一是記憶:工作記憶(KV 緩存)涉及記什么、如何壓縮與檢索,以及結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)的本體與關(guān)系。AI 的記憶系統(tǒng)將徹底革新存儲系統(tǒng)。

正是這種解耦、分布式、異構(gòu)的計算難題,催生了下一代產(chǎn)品 Vera Rubin。Vera Rubin 不是單一芯片,也不只是 GPU:它從 GPU(Vera Rubin NVL72)起步,由 Vera CPU 編排,配以革命性的存儲系統(tǒng),并通過 ConnectX-9、DOCA 軟件棧與內(nèi)置安全處理器,實現(xiàn)靜態(tài)、傳輸與使用全過程的加密,遵循機密計算。作為公司歷史上最雄心勃勃的工程,全部 4 萬名工程師參與其中。

NVIDIA 已從 GPU 公司演進為系統(tǒng)公司,如今進一步走向基礎設施尺度——發(fā)電、冷卻、電網(wǎng)等工業(yè)伙伴都已成為生態(tài)的一部分,因為客戶最終要建造的是 AI 工廠。

(視頻旁白)全球正在進行人類歷史上最大規(guī)模的基礎設施建設——AI 工廠。其每一層(芯片、機架、網(wǎng)絡、電力、冷卻、電網(wǎng))都必須端到端協(xié)同設計,因為算力即收入。NVIDIA DSX 是建造與運營 AI 工廠的參考設計藍圖:DSX Sim(Omniverse 藍圖)讓伙伴在訂購任何機架前先在數(shù)字世界中設計與驗證整座工廠;DSX OS 負責配置、運營、監(jiān)控與修復,把已裝系統(tǒng)變?yōu)榭尚?、多租戶、有韌性的算力;DSX MaxLPS 讓運營方在同樣電力預算內(nèi)安全部署更多 GPU,每年增加數(shù)十億美元收入,并以 45℃ 熱液冷卻節(jié)省水電;動態(tài)電力分配回收閑置瓦數(shù),機架內(nèi)電力平滑撫平電流尖峰;DSX Flex 讀取實時電網(wǎng)信號、在電網(wǎng)需要時回調(diào)電力。到本個十年結(jié)束前將有 100 吉瓦 AI 工廠上線。

四、AI 工廠生態(tài)與"算力即收入"

過去 NVIDIA 的計算層與軟件棧是被集成進第三方平臺的"計算生態(tài)",如今是"AI 工廠生態(tài)",處于更下游。每座 1 吉瓦級的 AI 工廠造價已從 200 億至 300 億美元升至 500 億至 600 億美元,并將達到每吉瓦 800 億至 1000 億美元。如此規(guī)模意味著必須一次建成、即刻可用,資金成本與復雜度都極高。

借助 Omniverse,這些巨型系統(tǒng)可在動土前就在數(shù)字世界中完整建造與模擬。NVIDIA 的產(chǎn)品線由此清晰:RTX 對應 GPU,DGX 對應系統(tǒng),DSX 對應基礎設施。憑借全棧能力,NVIDIA 能幫助小公司成長為世界級 AI 云:CoreWeave 已價值五六百億乃至七百億美元并高速增長,Nebius 同樣如此。這些云的客戶包括 Cursor(軟件編程)、Black Forest Labs(圖像生成)、World Labs(世界基礎模型)、Revolut(金融服務 AI)與 Shopify;Nscale 服務英國電信與谷歌;此外還有 Thinking Machines、韓國 NAVER Cloud(服務韓國銀行、現(xiàn)代等)、印度 Yotta、新加坡 Together AI 與 AI Singapore、印尼 Indosat,以及中國臺灣 GMI 等。AI 將無處不在,每家公司都將被它驅(qū)動,每個地區(qū)都將建造它。

這些云都需要計算棧——NVIDIA 的硬件、軟件、庫以及與全球第三方開發(fā)者生態(tài)的連接,使任何人都能搭建 AI 云。但 AI 云已極其復雜,這正是 NVIDIA 成為 AI 基礎設施公司的原因:算力即收入、即利潤,缺少二者就是虧損。

衡量一座 AI 基礎設施的關(guān)鍵指標有四個:

上線速度:NVIDIA 完全集成、親自建造并驗證整套基礎設施,因此首個 token、首次推理與訓練上線的時間都更快。

每瓦吞吐(每瓦 token 數(shù)):通過全棧集成、從頭設計、整體模擬與極致協(xié)同設計,做到世界級。在 1 吉瓦的電力上限下,每瓦吞吐就是收入;僅因芯片便宜而選錯架構(gòu)并不劃算。

可靠性:數(shù)據(jù)中心有海量活動部件與線纜,讓所有計算機協(xié)調(diào)可靠運行極難,平均無故障時間(MTBF)至關(guān)重要,長期大規(guī)模運行的經(jīng)驗是關(guān)鍵。

系統(tǒng)壽命:軟件持續(xù)演進(從 CNN 到 Transformer、專家混合,再到智能體系統(tǒng)),架構(gòu)若不靈活、生態(tài)若不豐富,壽命就難以保證。NVIDIA 系統(tǒng)遍布全球、開發(fā)者皆從 CUDA 起步,因而資產(chǎn)壽命更長、總擁有成本(TCO)更低。

當前算力需求是核心約束,需要全行業(yè)共同努力,在全球建起 AI 工廠。

Vera Rubin 現(xiàn)已全面投產(chǎn)。其供應鏈規(guī)模是 Grace Blackwell 的兩倍,單個機架的組裝時間從兩小時縮短到五分鐘,產(chǎn)能與吞吐都大幅提升。已有數(shù)百萬平方英尺廠房上線支撐 Grace Blackwell,并正為 Vera Rubin 爬坡。

(視頻旁白)處理智能體 AI 是與生成答案截然不同的難題:智能體要觀察、推理、規(guī)劃、使用工具,管理海量上下文,并按需啟動子智能體。NVIDIA Vera Rubin 是為智能體時代打造的多機架、Pod 級系統(tǒng),現(xiàn)已全面投產(chǎn)。從首臺 AI 超級計算機 DGX-1,到 Pascal、Ampere、首臺機架級的 Grace Blackwell,再到 Vera Rubin。它始于臺積電:七顆全新芯片經(jīng)數(shù)百道工序、3 納米工藝、CoWoS 先進封裝制成,搭配來自美光、SK 海力士與三星的 HBM4 內(nèi)存。Vera Rubin GPU 單板含六萬億晶體管、逾 18000 個元件;全新模塊化計算托盤以 PCB 中板精簡,ConnectX-9、SuperNIC 與 BlueField-4 DPU 均可免線纜維護;18 個計算托盤、9 個可熱插拔 NVLink 交換托盤,高效液冷母線承載逾 5000 安培(相當于 20 輛電動汽車全力加速),共 130 萬個元件構(gòu)成第三代 MGX 機架。微軟、戴爾與 CoreWeave 均已搭起 Vera Rubin NVL72 工程機架。Vera CPU 機架在單一液冷機架內(nèi)集成 256 顆 CPU;富士康與廣達打造的 Vera LPX 機架在 16 個托盤上集成 256 顆 Groq LPU,提供每秒 40 PB 的 SRAM 帶寬用于超低延遲——NVL72 以最高吞吐生成 token,LPX 以最低延遲生成。Vera BlueField-4 STX 負責存儲處理與芯片內(nèi)安全;NVIDIA Spectrum-X 以太網(wǎng)光子學是全球首款采用 200 千兆共封裝光學的以太網(wǎng)交換機。Vera Rubin 由五套相連的機架級系統(tǒng)構(gòu)成,背后是中國臺灣 150 家供應鏈伙伴、數(shù)百萬平方英尺廠房與數(shù)百個站點,這就是極致協(xié)同設計。

五、Vera Rubin 系統(tǒng)揭幕

Vera Rubin 不只是為運行 AI 而造,而是為運行智能體而造。智能體架構(gòu)是計算機科學最近一次偉大突破,歷經(jīng)多年才實現(xiàn)潛力、變得有用,運行它的計算機理應是全球最先進的。

現(xiàn)場展示的系統(tǒng)包括:Vera Rubin NVL72、LPX 機架、含 256 顆液冷 CPU 的 Vera CPU 機架、兼具存儲與安全功能的 Vera BlueField 系統(tǒng),以及 Mellanox 網(wǎng)絡(全球首款 CPO,共封裝光學)。

回顧歷程:Hopper 為預訓練而造;Grace Blackwell 時期,業(yè)界曾認為推理簡單,但推理等于收入,且 MoE 模型在高響應速度、強交互與高吞吐下同時實現(xiàn)極難,因此 NVIDIA 創(chuàng)造了 NVL72。憑借極致協(xié)同設計,NVIDIA 今天的 token 成本是全球最低,且領(lǐng)先達數(shù)量級。Vera Rubin 則更進一步,面向"智能體系統(tǒng)中的推理"。

新系統(tǒng)取消了線纜、水管與風扇,改用中間 PCB 連接兩側(cè),組裝時間從兩小時縮短到五分鐘,可靠性與韌性大幅提升。其中包括最先進的 Vera CPU 托盤、含兩顆 Vera CPU 與四個 ConnectX-9 的存儲托盤、面向低延遲推理的 Groq LPX 機架(可通過 Groq LPU 進一步擴展),以及革命性的 NVLink 交換托盤與用于橫向擴展的以太網(wǎng)交換機。憑借為 Grace Blackwell 引入的這兩套系統(tǒng),NVIDIA 已成為全球最大的網(wǎng)絡公司。

六、Vera CPU:為智能體打造的 CPU

此前所有 CPU 都是為人而造:人以"秒"為單位使用,云上按核心數(shù)出租。但智能體以"納秒"為單位運作,且極其沒耐心——使用工具、訪問數(shù)據(jù)庫時都要求盡可能快的響應,任何等待都會拖慢后續(xù)步驟。因此 NVIDIA 為 AI 時代打造了 Vera CPU。

在 NVIDIA 系統(tǒng)中,Vera 有三種用途:在 Vera Rubin 機架內(nèi)(已含兩顆 CPU),一顆用于編排管理 GPU、管理 KV 緩存與機架內(nèi)軟件,另由 Grace BlueField 負責安全與隔離;Vera 計算單元負責載體、模型編排、工具調(diào)用與數(shù)據(jù)庫訪問;Vera BlueField 數(shù)據(jù)服務器則是全球最快的存儲服務器。這些處于數(shù)據(jù)中心最昂貴環(huán)節(jié)的關(guān)鍵路徑上,因為 token 正是在此生成,必須盡量多產(chǎn)且不被拖累。

由于 NVIDIA 已制造并售出數(shù)以百萬計的 Grace Blackwell 與 Vera Rubin,公司已是全球最大的 CPU 制造商之一。Vera 是一顆從頭打造的全新架構(gòu),有四個要點:

每時鐘指令數(shù)(IPC)/單線程性能:必須世界級以保證低延遲。Vera 的 IPC 全球最高,每時鐘周期可取指、譯碼并執(zhí)行 10 條指令。

每核心帶寬:數(shù)據(jù)進出 CPU 的帶寬世界級。

整體帶寬:智能體系統(tǒng)解耦且分布式,網(wǎng)絡成為瓶頸,因此核間、CPU 與存儲、CPU 與 GPU 之間都需極高帶寬。Vera 以每秒 3.6 TB 的互聯(lián)架構(gòu)在光速級別連接所有核心,無跨芯片邊界,各核協(xié)同而非逐核出租;它是首款采用 PCIe Gen 6 的 CPU,并采用 LPDDR5、帶寬達每秒 1.2 TB,約為市面最高性能 CPU 的兩到三倍。

能效:智能體數(shù)量將達數(shù)十億(遠超人口),CPU 必須在高性能的同時極其節(jié)能,以免占用本應用于 token 生成的電力。

與最高性能的 x86 相比,Vera 在真實單線程性能上遙遙領(lǐng)先。CPU 上 5%–10% 的提升已屬難得,而這種量級的提速前所未有。

(視頻旁白)智能體 AI 改變了 CPU 的角色:CPU 是指揮,GPU 是樂團。傳統(tǒng) CPU 為另一時代而建(最大化核心數(shù)、切片、虛擬化、按時出租),在智能體時代反而成為 GPU 利用率的瓶頸,直接影響 token 吞吐、延遲與體驗。NVIDIA Vera 為智能體循環(huán)而生,將定制數(shù)據(jù)中心 CPU 核心與可擴展一致性互聯(lián)架構(gòu)結(jié)合,平衡性能、核心數(shù)與帶寬。其核心是 NVIDIA Olympus 核心,面向分支密集的 Python 運行時、工具調(diào)用與沙箱代碼執(zhí)行:神經(jīng)分支預測器每周期評估兩條采納分支,10 路寬譯碼引擎、大型亂序執(zhí)行引擎與帶圖引擎的高級預取器協(xié)同工作。Vera 是首款使用 LPDDR5X、同時糾正多重錯誤而不損帶寬的 CPU,峰值內(nèi)存延遲比 x86 低 40%。第二代可擴展一致性互聯(lián)架構(gòu)將 88 個 Olympus 核心統(tǒng)一在單片網(wǎng)格上,內(nèi)存與核心不拆分到不同小芯片,核間通信比傳統(tǒng) CPU 快 50%;內(nèi)存一致的 NVLink 芯片到芯片把 GPU 直連 CPU,并可將 Vera 擴展到多路插槽。Vera 提供 x86 的 1.8 倍智能體沙箱性能。

七、Vera CPU 的性能與新市場

Vera 將成為 NVIDIA 新的主要增長引擎。Grace 與 Vera 也是 AI 領(lǐng)域最經(jīng)充分驗證的 CPU:幾乎每個數(shù)據(jù)中心、云、企業(yè)都已完成對 Grace 的適配認證,軟件與安全棧均已優(yōu)化;如今各公司將轉(zhuǎn)向驗證 Vera。Grace Blackwell 過渡期最大的風險是從外部 x86 切換到 Grace,而 NVIDIA 以出色執(zhí)行力完成,如今 Grace 已與 Grace Blackwell 幾乎同義、無處不在。

性能方面:SQL(由 IBM 發(fā)明、全球通用的結(jié)構(gòu)化數(shù)據(jù)庫語言)極難加速,Vera 讓其快三倍;面向工廠、證券交易所等場景的實時流處理(與紐約證券交易所合作、由其主席 Lynn Martin 支持)則快六倍。這些都得益于帶寬、單線程執(zhí)行與芯片內(nèi)外的高帶寬。

在 CPU 真實工作負載上談"倍數(shù)提升"極為罕見。Vera 正在開辟一個前所未有的新市場:為智能體打造的 CPU。它不會取代舊市場,但因為智能體數(shù)量將遠超人口、且極沒耐心,這一市場必將更大。中國臺灣的 ODM、電腦制造商與 OEM 已成為早期合作伙伴,而最早的采用者正是各類智能體公司。

八、企業(yè)級 AI 智能體工具包與 Nemotron

未來十年的應用與計算范式是:智能體與載體編排著大語言模型。每家公司都將運行智能體、成為智能體公司,并意識到智能體需要自己的操作系統(tǒng),也都在追問如何安全運行與構(gòu)建智能體。為此 NVIDIA 推出企業(yè)級 AI 智能體工具包(NVIDIA Agent Toolkit for Enterprise AI),其包含四要素:

模型:越聰明、越便宜、越快越好。

載體(harness):編排整套流程。

工具與技能:模型需調(diào)用工具,CUDA-X 庫將成為絕佳工具。

運行時:把一切串聯(lián)起來的操作系統(tǒng)。

工具包包含可修改的世界級開放模型,可運行任意智能體(如 Claude Code、Codex)。其中 NVIDIA OpenShell 是高度安全的載體,保護智能體、使其遵循安全策略并維護隱私、權(quán)限與身份;OpenShell 已開源并被紅帽、Canonical、微軟等廣泛采用,針對無處不在的 NVIDIA AI 平臺優(yōu)化,可在任意云、本地乃至設備上運行。此外還有 OpenClaw、Hermes 等智能體載體。這四要素共同構(gòu)成現(xiàn)代企業(yè)的操作系統(tǒng)。

一個典型用例是芯片設計:NVIDIA 與 Cadence 合作打造芯片設計超級智能體,由 Codex 或 Claude Code 編排,以 RTL、架構(gòu)圖、原理圖或規(guī)格說明為輸入,并基于 Nemotron 針對 NVIDIA 平臺優(yōu)化。

(視頻旁白)Cadence 與 NVIDIA 合作打造芯片設計智能體。設計含數(shù)以萬億計晶體管、皮秒級同步的三維電路極難,物理樣機過慢過貴,工程師須在數(shù)字世界中工作:架構(gòu)規(guī)格譯為 RTL,再于仿真中驗證,一個 bug 即可讓芯片延期數(shù)月。兩家公司構(gòu)建的設計驗證智能體由 Codex 編排,Cadence Chip Stack 啟動 RTL 驗證循環(huán),由 Nemotron 驅(qū)動、OpenShell 保護,并調(diào)用 RTL 生成、測試平臺創(chuàng)建、回歸測試與調(diào)試等專家子智能體;系統(tǒng)自我驅(qū)動,用 Cadence Xcelium 運行數(shù)百次仿真、用 JasperGold 做形式化驗證,使驗證周期快逾 40 倍,從數(shù)周縮短到數(shù)小時。

NVIDIA 擁有數(shù)千名芯片設計師,并將引入數(shù)十萬個 Cadence 超級智能體協(xié)同工作,以加速研發(fā)。這套工具包(模型、載體、CUDA 加速的庫與工具、運行時)的起點是優(yōu)秀的開放模型——Nemotron。

今天發(fā)布的 Nemotron 3 Ultra 不僅開放模型,還開放訓練所用的全部數(shù)據(jù)與訓練腳本;得益于合作伙伴聯(lián)盟共享數(shù)據(jù),它在全球最大的一批長程推理、長程工具任務求解與工具使用數(shù)據(jù)集上訓練而成。它是全球首個基于 SSM(狀態(tài)空間模型)與專家混合(MoE)混合架構(gòu)的模型,速度快五倍、運行成本(總 FLOPs 與總推理時間)比最具成本效益的開放模型還低 30%,且保持前沿級智能、完全開放。Nemotron 4 正在研發(fā)中。

憑借這套工具包,每家企業(yè)都能像 Cadence 那樣構(gòu)建自己的超級智能體。合作伙伴已包括 Cadence、CrowdStrike、ServiceNow、Palantir、SAP 等。與"智能體會顛覆這些市場"的預期相反,智能體將為合作伙伴創(chuàng)造前所未有的最大機遇。

至此三項要點清晰:其一,Vera Rubin 全面投產(chǎn);其二,Vera CPU 為新一代智能體而造;其三,企業(yè)級 AI 工具包讓每家企業(yè)與企業(yè)軟件公司都能構(gòu)建智能體。

九、重新發(fā)明 PC:RTX Spark 與全新 Windows 產(chǎn)品線

現(xiàn)代計算機產(chǎn)業(yè)起步于約 40 年前,NVIDIA 成立 33 年。Windows 95 讓 PC 從企業(yè)走向消費者,其成功源于恰當?shù)慕怦钆c抽象——系統(tǒng) BIOS、開放芯片組、可在運行時安裝驅(qū)動的操作系統(tǒng)、帶多媒體 API 的抽象層。

40 年后,微軟與 NVIDIA 歷時三年重新發(fā)明 PC。智能體計算范式將同時運行于 AI 云、企業(yè)內(nèi)部與個人 PC。當 PC 擁有能理解你、與你對話、替你處理事務與做研究的自主智能體時,其形態(tài)將徹底改變。新的操作系統(tǒng)即"舊操作系統(tǒng) + 大語言模型"——大語言模型相當于現(xiàn)代版 DirectX,具備輸入輸出、理解提示詞與計算機視覺、生成視頻與聲音的能力,是 PC 的智能延伸;應用程序則被智能體運行時取代。

(視頻旁白)一切始于一束火花。RTX Spark 把 33 年的積累濃縮進一顆芯片:含 6144 個 Tensor Core 的 Blackwell RTX GPU、一 PetaFLOP 的 AI 性能、與聯(lián)發(fā)科合作的定制 20 核 Grace CPU、由 NVLink 融合、128 GB 統(tǒng)一內(nèi)存、臺積電 3 納米工藝、700 億晶體管,并與微軟協(xié)作打造面向智能體的 Windows 平臺。

RTX Spark 由 NVIDIA 與聯(lián)發(fā)科合作打造,100% 的 NVIDIA 軟件都能在其上運行——從數(shù)字生物學、地震資料處理、天體物理,到物理、生物、基因組學、AI 與計算機圖形學,再加上 Windows 歷來運行的每一個應用,并新增運行智能體的能力。

(視頻旁白)一個在 RTX Spark 上本地運行的智能體(OpenShell 沙箱、Hermes 載體、連接云端 Claude Sonnet)可協(xié)助設計房屋:依據(jù)選定地塊、概念草圖、風格情緒板與需求描述,調(diào)用本地工具在 Rhino 中建模地形與建筑體量、提出經(jīng)成本與舒適度優(yōu)化的形態(tài)、生成室內(nèi)布局并自動放置門窗與結(jié)構(gòu)構(gòu)件、自檢并修正錯誤;批準后將模型連同上下文導出至 Blender,渲染后再用生成式 AI(Flux 2 模型)轉(zhuǎn)為多視角、多光照的照片級效果。

合作伙伴反響熱烈。Adobe 已重構(gòu) Photoshop 與 Premiere 的核心并將為 RTX Spark 發(fā)布,速度提升一倍,并通過 MCP 服務器實現(xiàn)對智能體友好的交互。這是 40 年來第一次偉大的 PC 重塑,全球 PC 產(chǎn)業(yè)幾乎全員加入。

更進一步,微軟與 NVIDIA 發(fā)布全新產(chǎn)品線——覆蓋臺式機、筆記本與工作站的三款革命性 Windows 機器,全部 100% 兼容 Windows、CUDA 與 NVIDIA AI Tensor Core。其中臺式機(如微星機型)可讓智能體 7×24 全天候運行、無按量計費,并連接家中筆記本、顯示器、攝像頭、家電與安防系統(tǒng),成為隨時間不斷變聰明的個人 AI(從 Nemotron 3 Ultra 持續(xù)升級至更新版本)。面向開發(fā)者的 DGX Station 兼容 Windows、配備 768 GB 內(nèi)存、20 PetaFLOPs 算力與每秒 8 TB 內(nèi)存帶寬,可在桌邊運行萬億參數(shù)模型,部署時再遷入云端。

正如手機演變?yōu)橹悄苁謾C,10 年后的 PC 將與今天截然不同:未來家庭中或?qū)⒂幸慌_運行所有智能體與助手的 AI 超級計算機,其角色更接近 R2-D2 或 C-3PO,而非傳統(tǒng) PC。NVIDIA 已為此制定路線圖——每一代架構(gòu)都將提供臺式機、筆記本與工作站,且全球 100% 的 PC 產(chǎn)業(yè)均已加入。

十、物理 AI 與機器人:Cosmos、Alpamayo、Isaac GR00T

智能體 AI 本質(zhì)上是數(shù)字機器人,會運行在各類計算機上:人形機器人、自動駕駛汽車、衛(wèi)星,乃至農(nóng)業(yè)、制造與重工業(yè)設備,甚至未來的基站(理解流量、與其他基站協(xié)同以降低能耗、提升頻譜效率)。隨時間推移,全球?qū)⒂袛?shù)百億乃至上千億個智能體系統(tǒng)在運轉(zhuǎn)。

最大的難題是數(shù)據(jù)。語言模型的訓練數(shù)據(jù)來自人類視角,而機器人數(shù)據(jù)須來自機器人視角;現(xiàn)實世界的視頻多為第三人稱,因此物理 AI 的數(shù)據(jù)問題最難。NVIDIA 沿此逐級推進:先用遠程操作(人類示范,類比 RLHF),再用仿真(Omniverse,類比可驗證獎勵的強化學習 RLVR)為物理 AI 模型做引導,進而從第三人稱數(shù)據(jù)學習并重投影到第一人稱,最終得到能從任意視角理解物理世界的世界基礎模型(World Foundation Model)。

今天發(fā)布的 Cosmos 3 是物理 AI 的前沿。在物理 AI 領(lǐng)域 NVIDIA 處于全球領(lǐng)先,Cosmos 3 可作為各類機器人工作的基礎模型,能理解、推理、生成、仿真,并在閉環(huán)中充當策略本身,在全球排行榜上名列前茅。

(視頻旁白)真實世界無限且不可預測,真實數(shù)據(jù)無法規(guī)模化,對物理 AI 而言"算力即數(shù)據(jù)"。Cosmos 是面向物理 AI 的開放前沿全能模型,基于全新的 Transformer 混合架構(gòu):像素、動作、聲音與語言流入自回歸 Transformer 進行推理與規(guī)劃,并指揮擴散 Transformer 生成后續(xù)內(nèi)容。它可作為 VLM 觀察并描述世界、作為世界模型從圖像/文本/視頻生成物理精確的合成視頻、作為仿真器為策略訓練與評估閉環(huán),并作為 NVIDIA OmniDreams(以動作為條件的世界模型)的基礎逐幀預測未來;經(jīng)后訓練即成為感知—推理—規(guī)劃—生成動作的世界動作模型。Cosmos 與 Nemotron 一樣完全開放(開放模型、數(shù)據(jù)與訓練方法),可被增強為專有模型。

AI 棧中模型最易理解,但完整棧還包含生成器、仿真器與運行時。汽車本質(zhì)上是物理 AI(自動駕駛的智能體機器人),同樣擁有復雜的棧。

今天發(fā)布的 Alpamayo 2 Super 是面向自動駕駛汽車的開放模型。簽約 NVIDIA DRIVE Hyperion 的品牌約占全球汽車制造商的 80%,全球約 97% 的出行服務也已與 NVIDIA 對接;在 DRIVE Hyperion 運行時與 Halos 操作系統(tǒng)上部署后,可連接全球這些服務。它是全球首輛會推理的自動駕駛汽車——會持續(xù)"自言自語"地進行思考,完成路線規(guī)劃、避讓、讓行、保持車距等操作。

這項技術(shù)同樣適用于人形機器人。NVIDIA Isaac GR00T 是人形機器人棧,涵蓋模型、數(shù)據(jù)生成、仿真與含操作系統(tǒng)的運行時。NVIDIA 的所有系統(tǒng)(云、PC、自動駕駛、人形機器人的智能體/機器人系統(tǒng))采用完全相同的架構(gòu),并以極致協(xié)同設計垂直集成、再向所有人開放。機器人系統(tǒng)因電機、傳感器眾多而復雜脆弱,因此需要參考平臺。

今天發(fā)布的 NVIDIA Isaac GR00T 參考人形機器人完全集成:每只手 25 個自由度(由 Sharpa 制造),全身 31 個自由度,6 英尺高、150 磅重,運行全新 Jetson Thor 與完整軟件棧(數(shù)據(jù)生成、仿真、運行時),主要面向高校與研究者。

(視頻旁白)通用人形機器人是 AI 的下一次飛躍,但搭建極難,各團隊常從零拼湊仿真器、遠程操作、數(shù)據(jù)管線與訓練設施,耗時數(shù)月。NVIDIA Isaac GR00T 是開放開發(fā)平臺:含開放模型、仿真與訓練庫、數(shù)據(jù)生成器,以及預配置好、數(shù)小時即可上手的機器人計算機。流程為:在 Isaac Lab 搭建仿真環(huán)境,用 Isaac Teleoperation 采集示范,用 Omniverse 與 Cosmos 把一次示范擴展為上千次合成數(shù)據(jù),訓練策略并在 Isaac Lab Arena 評估,再通過 Isaac ROS 部署到 Jetson Thor。各組件模塊化、開放,可用 NVIDIA 的或自行替換。

十一、總結(jié)

過去六個月里,計算機產(chǎn)業(yè)被徹底改變:智能體得以實現(xiàn),并與最新前沿模型收斂,使 AI 能夠做有用的工作。這一計算范式將不斷重復——智能體擁有模型,載體攜帶帶技能的工具,運行于云、本地、PC 或機器人之上;范式相同,而載體、模型可按偏好選擇并針對專有用途改進,甚至打造可供他人使用的超級智能體。

Vera Rubin 已全面投產(chǎn):Grace Blackwell 為處理 AI(尤其推理)而生,Vera Rubin 則為運行智能體而生,是一整套解耦、分布式的智能體處理系統(tǒng)。NVIDIA 已成為基礎設施公司,幫助客戶盡快實現(xiàn)最大收入與利潤。為智能體(而非為人)打造的 Vera CPU 具有獨特需求,其訂單已到,有望成為公司歷史上最快、最成功的產(chǎn)品發(fā)布。

NVIDIA 與微軟共同開啟全新 PC 產(chǎn)品線,而相同的智能體計算范式未來還將運行于機器人、衛(wèi)星、基站、工廠等各類設備,遍及云、本地與邊緣。人們對個人電腦的認知很可能將因此改變。

相關(guān)標簽
硅星人

硅星人

硅是創(chuàng)造未來的基礎,歡迎登陸硅星球。

訂閱

覺得文章不錯,微信掃描分享好友

掃碼分享

企業(yè)資訊

查看更多內(nèi)容