在小說(shuō)閱讀器讀本章
去閱讀
文 / 王新喜
2026 年 4 月 7 日,中國(guó) AI 圈炸了。全球頂級(jí)大模型 DeepSeek 官方宣布:DeepSeek 下一代旗艦?zāi)P?V4 將完全運(yùn)行于華為昇騰 950PR 芯片,技術(shù)架構(gòu)從 CUDA 全面轉(zhuǎn)向 CANN 框架。
而最新消息,DeepSeek 創(chuàng)始人梁文鋒近日在內(nèi)部溝通中透露,DeepSeekV4 將于 4 月下旬發(fā)布,中國(guó) AI 產(chǎn)業(yè)在去 "CUDA 化 " 路上邁出關(guān)鍵一步。
deepseek V4 跟國(guó)產(chǎn) AI 芯片的適配,這將使得 deepseek 成為國(guó)內(nèi)首個(gè)在推理階段徹底擺脫英偉達(dá)算力依賴的萬(wàn)億級(jí)參數(shù)大模型。
回到 2025 年初,DeepSeek 以低成本訓(xùn)練的 V3 和 R1 模型震動(dòng)全球,其極低的開(kāi)發(fā)成本與接近甚至 OpenAI 的性能表現(xiàn),打破了 " 算力決定一切 " 的固有認(rèn)知,為全球 AI 發(fā)展提供了新思路,這引發(fā)美股科技板塊大幅拋售,市場(chǎng)開(kāi)始重新評(píng)估英偉達(dá)等 AI 算力基礎(chǔ)設(shè)施公司的估值邏輯。
但那一輪沖擊背后,DeepSeek 使用的算力硬件仍然相當(dāng)程度上依賴英偉達(dá)的芯片,包括出口限制相對(duì)寬松的 H800 型號(hào)。
隨后,美國(guó)進(jìn)一步收緊出口管制,英偉達(dá)最頂級(jí)的 H100、H200,B200 全部禁用,后來(lái)連英偉達(dá)的 H20 芯片也被禁止向中國(guó)出售。
這實(shí)質(zhì)上切斷了中國(guó) AI 公司通過(guò) " 降規(guī)格版本 " 獲取高性能算力的渠道。DeepSeek 已經(jīng)用算法優(yōu)化把有限算力的性能壓榨到了極致——他們?cè)缙谟?" 混合專家 " 架構(gòu),把模型推理成本砍掉了 90%,震驚了全球。
DeepSeek 需要的不是更好的芯片,而是有自主可控的芯片可用。如今,華為已經(jīng)滿足了 DeepSeek 的訴求。
2026 年 4 月 6 日,據(jù) The Information 等媒體爆料,DeepSeek 下一代旗艦?zāi)P?V4 已全面遷移至華為昇騰 950PR,底層代碼從 CUDA 重寫為 CANN 框架。
按照行業(yè)慣例,新模型發(fā)布前通常會(huì)提前數(shù)月向芯片廠商開(kāi)放測(cè)試權(quán)限,進(jìn)行針對(duì)性性能優(yōu)化。但 DeepSeek 這次選擇了完全不同的路徑:他們直接拒絕了英偉達(dá)的早期訪問(wèn)請(qǐng)求,反而把模型優(yōu)先開(kāi)放給華為和寒武紀(jì)等國(guó)產(chǎn)芯片廠商。
這種做法在 AI 圈幾乎是反著來(lái),信號(hào)卻再明確不過(guò):V4 從一開(kāi)始就是為國(guó)產(chǎn)算力量身定制,英偉達(dá)被排除在外,要徹底擺脫對(duì)美國(guó)芯片的依賴。
華為昇騰 950PR 芯片早在 2026 年 3 月 21 日就正式發(fā)布,并配套華為自研的 Atlas 350 加速卡方案。
根據(jù)華為公開(kāi)的技術(shù)規(guī)格和第三方機(jī)構(gòu) Digitimes 的評(píng)測(cè),Ascend 950PR 的算力性能接近被禁英偉達(dá) H20 芯片的三倍,多模態(tài)生成速度快 60%,自研 HBM 容量達(dá) 112GB,算力利用率從行業(yè)平均 60% 提升至 85% 以上,部署成本降至英偉達(dá)方案的 1/3。
值得一提的是,華為昇騰 950PR 芯片配套華為自研的 Atlas 350 加速卡方案。這張加速卡,使用的是全新昇騰 950PR(Ascend 950PR)處理器。其性能方面,Atlas 350 的單卡算力達(dá)到了英偉達(dá) H20 的 2.87 倍,更是國(guó)內(nèi)唯一支持 FP4 低精度的推理產(chǎn)品。
FP4 是一種 " 用精度換效率 " 的技術(shù),能讓大型 AI 模型在更少的顯存中運(yùn)行。原本需要 4 張加速卡才能支撐的 700 億參數(shù)模型,現(xiàn)在 1 張卡即可輕松容納。以 700 億參數(shù)的大模型為例,原本需要 140GB 顯存,使用 FP4 后僅需 35GB 就能流暢運(yùn)行。
這意味著在相同的硬件條件下,可以部署更大規(guī)模的模型,或者支持更多的并發(fā)推理請(qǐng)求。
在當(dāng)前 "Token 通脹 " 的時(shí)代背景下—— OpenClaw 的 Token 消耗量一個(gè)月內(nèi)從 806 億飆升至 3580 億,增長(zhǎng)了約 3.4 倍—— FP4 帶來(lái)的效率提升,直接轉(zhuǎn)化為成本優(yōu)勢(shì)。
華為計(jì)劃 2026 年全年出貨約 75 萬(wàn)顆該型號(hào)芯片,并已于今年 1 月開(kāi)始向字節(jié)、阿里等主要客戶發(fā)送樣品測(cè)試。這么多合作伙伴支持,意味著這不只是一次技術(shù)升級(jí),更是一次戰(zhàn)略性的 " 換芯手術(shù) ",國(guó)內(nèi)一眾廠商是真的有意識(shí)選擇另外一個(gè)生態(tài)圈了。
DeepSeek V4 與華為 Ascend 950PR 的組合,也將成為國(guó)產(chǎn)算力能否支撐頂級(jí)前沿模型訓(xùn)練的一次真實(shí)檢驗(yàn)。
給世界第二個(gè)選擇,AI 大模型生態(tài)迎來(lái) iOS 與安卓之爭(zhēng)
因?yàn)槊绹?guó)出口管制,英偉達(dá)的高端芯片對(duì)中國(guó)市場(chǎng)的供應(yīng)一直在收緊,DeepSeek 是被現(xiàn)實(shí)逼出來(lái)的生存選擇——誰(shuí)手里有自主可控的芯片,誰(shuí)就能第一時(shí)間通過(guò)自家云服務(wù)把模型跑起來(lái),集成進(jìn) AI 應(yīng)用里,不用看任何人的臉色,不用怕任何突如其來(lái)的管制。
DeepSeek 盡管訓(xùn)練端仍依賴英偉達(dá)(華為訓(xùn)練芯片 950DT 預(yù)計(jì) Q4 上市),軟件生態(tài)也需完善,但 " 昇騰 +DeepSeek" 組合已為國(guó)產(chǎn) AI 開(kāi)辟了成本可控、安全自主的新路徑。據(jù)知情人士說(shuō),在 V4 訓(xùn)練和推理上,昇騰 950PR 的表現(xiàn)達(dá)到了預(yù)期,否則 DeepSeek 不會(huì)拍板全面遷移。
國(guó)產(chǎn) AI 產(chǎn)業(yè)正從 " 被迫適應(yīng) " 到 " 主動(dòng)選擇 " 的歷史性轉(zhuǎn)變,這個(gè)信號(hào)會(huì)帶動(dòng)一批人跟進(jìn),整個(gè)國(guó)產(chǎn)芯片的軟件生態(tài)就能慢慢活起來(lái)。
DeepSeek 帶頭做模型原生適配,華為做芯片和底層框架,國(guó)內(nèi)大廠拿訂單鋪場(chǎng)景,中國(guó) AI 有望第一次形成 " 上游芯片 - 中游模型 - 下游應(yīng)用 " 全鏈條的完整閉環(huán)。從硬件到軟件,從訓(xùn)練到落地,全流程都握在自己手里。
而更大的意義,還在于給出世界第二個(gè)選擇。在去年,DeepSeek 橫空出世通過(guò)技術(shù)優(yōu)勢(shì)在世界舞臺(tái)上大放光芒,通過(guò)開(kāi)源策略與低價(jià) API 服務(wù),推動(dòng)全球開(kāi)發(fā)者生態(tài)建設(shè),DeepSeek 是全球被引用最多的開(kāi)源 AI 模型之一,有大量開(kāi)發(fā)者在用它的代碼和框架。
如果 V4 在昇騰上跑起來(lái)效果好,可能會(huì)在全球范圍內(nèi)吸引開(kāi)發(fā)者順著這條路,開(kāi)始認(rèn)真評(píng)估昇騰方案。
以前,搞 AI 大模型,基本繞不開(kāi)英偉達(dá)的芯片與 CUDA 生態(tài),現(xiàn)在華為昇騰 +CANN 的出現(xiàn),全世界的客戶有了第二選項(xiàng),這意味著所有雞蛋不用放在一個(gè)籃子里了。當(dāng)年安卓替代塞班,不是因?yàn)榘沧扛冗M(jìn),是因?yàn)榻o了整個(gè)行業(yè)另一個(gè)選擇。
DeepSeek V4 接入了華為芯片,它其實(shí)就是中國(guó) AI 行業(yè)的 " 安卓時(shí)刻 ",一旦在中國(guó)打開(kāi)局面,或?qū)L(fēng)靡全球,包括歐洲、東南亞的一些國(guó)家和企業(yè),都有了一個(gè)性能同樣強(qiáng)大的 AI 生態(tài)備選項(xiàng)。
原來(lái)圍著英偉達(dá)的 CUDA 轉(zhuǎn)的圈子,會(huì)慢慢被華為的昇騰生態(tài)吸附過(guò)來(lái),未來(lái)的 AI 競(jìng)爭(zhēng),也將形成兩大生態(tài)之爭(zhēng),這就像全球手機(jī)市場(chǎng)生態(tài)系統(tǒng)之爭(zhēng),逐步形成蘋果 iOS 和谷歌安卓生態(tài),形成雙雄競(jìng)爭(zhēng)的格局,以后 AI 芯片與算力的競(jìng)爭(zhēng),也將變成兩大生態(tài)的競(jìng)爭(zhēng)。
相比英偉達(dá)方案,華為芯片加 V4 組合,硬件采購(gòu)成本降低 40%,推理成本降低 60%,而且在美國(guó)芯片出口管制下,國(guó)產(chǎn)芯片與國(guó)產(chǎn)模型組合能實(shí)現(xiàn)全鏈路自主可控。
也就是說(shuō),在 AI 硬件成本與供應(yīng)鏈安全可控層面,中國(guó)的 AI 路線反而有自己的優(yōu)勢(shì)。這對(duì)應(yīng)了東南亞、歐洲等一些國(guó)家追求降本增效,且避免被美國(guó)未來(lái)出口管制掣肘的風(fēng)險(xiǎn)。
因此,這一次 DeepSeek 與華為的雙向奔赴的結(jié)果如何,不僅關(guān)系到 DeepSeek 一家公司的技術(shù)路線,也將在相當(dāng)程度上決定整個(gè)中國(guó) AI 產(chǎn)業(yè)的發(fā)展以及市場(chǎng)客戶對(duì)國(guó)產(chǎn)芯片的信心走向。
今天的昇騰與英偉達(dá)的差距客觀存在,但這是一場(chǎng)持久戰(zhàn),關(guān)鍵意義在于,今天這扇門被真正推開(kāi)了一條縫,接下來(lái)就能越開(kāi)越大。
中國(guó) AI 在未來(lái) 3~5 年實(shí)現(xiàn)算力自主,這種 " 應(yīng)用生態(tài)突圍 + 硬件換道 " 的組合拳,可能有望進(jìn)一步打破算力囚牢困境,并且有望通過(guò)這條路線的成功,在全球市場(chǎng)打開(kāi)新的局面,中美 AI 兩大生態(tài)的較量將拉開(kāi)序幕,我們拭目以待。