电竞比分网-中国电竞赛事及体育赛事平台

關(guān)于ZAKER 合作
鈦媒體APP 1小時(shí)前

算力通脹元年 :DeepSeek 越便宜 , 這輪漲價(jià)越難停

文 | 強(qiáng)調(diào) Next

明天(4 月 18 日),阿里云、百度智能云將正式開始調(diào)價(jià)。3 周之后,騰訊云也將迎來新一輪漲價(jià)。全球范圍內(nèi),OpenAI、Anthropic 在過去 18 個(gè)月里把 API 價(jià)格降了超過 80%,DeepSeek-R1 的出現(xiàn)更讓外界相信推理成本即將歸零。

結(jié)果,中國三大云廠商在同一周宣布漲價(jià) 20% 至 30%。

媒體的第一反應(yīng)是 " 價(jià)格戰(zhàn)結(jié)束,大廠開始收割 "。這個(gè)定調(diào)不算錯(cuò),但它停在了最表層的解讀上。它解釋了云廠商為什么要漲,卻沒有回答更關(guān)鍵的問題:這次漲價(jià)是短暫修正,還是一個(gè)持續(xù)性趨勢的起點(diǎn)?答案,藏在一個(gè) 150 年前的經(jīng)濟(jì)學(xué)悖論里。

01. 杰文斯悖論:越便宜,燒得越兇

1865 年,英國經(jīng)濟(jì)學(xué)家威廉 · 杰文斯觀察到一個(gè)反直覺現(xiàn)象:蒸汽機(jī)效率提升之后,英國的煤炭消耗總量反而急劇增長:效率提升降低了使用成本,觸發(fā)了需求爆炸。這就是杰文斯悖論(Jevons Paradox),它在 2026 年的算力市場里精準(zhǔn)復(fù)現(xiàn)了。

DeepSeek-R1 確實(shí)讓單 Token 推理成本大幅下降。但它同時(shí)打開了一個(gè)需求閘門:大量此前覺得 "AI 太貴 " 的企業(yè),開始把 AI 嵌進(jìn)業(yè)務(wù)流程。一旦嵌入,Token 消耗量以非線性速度膨脹。

更關(guān)鍵的變化是,AI 的應(yīng)用已經(jīng)從 " 對(duì)話 " 進(jìn)入 " 做事 ":Agent 和 Reasoning Model 登場了。一個(gè)任務(wù)以前燒 1000 個(gè) Token,接上思維鏈之后燒 5000 個(gè),因?yàn)?Reasoning Model 會(huì)自己 " 思考 ",消耗量是普通模式的 10 到 50 倍。

DeepSeek 降低了起步門檻,卻捅破了算力天花板。每一單位 Token 越來越便宜,但每一個(gè)業(yè)務(wù)任務(wù)卻越來越貴。這才是這輪漲價(jià)得以成立的真實(shí)地基。

02. 開源了權(quán)重,沒開源推理?xiàng)?/strong>

另一個(gè)被大量報(bào)道忽略的細(xì)節(jié):DeepSeek 開源了模型權(quán)重,但沒有開源它的推理優(yōu)化棧。這兩者的差別,好比給你了發(fā)動(dòng)機(jī)的設(shè)計(jì)圖紙,卻沒告訴你怎么調(diào)出 F1 的性能。

真正決定推理成本的,不只是模型架構(gòu),而是藏在水面下的工程能力:投機(jī)解碼(Speculative Decoding)的命中率、KV Cache 的內(nèi)存調(diào)度策略、Prefill 與 Decode 階段的分離優(yōu)化、萬卡集群的網(wǎng)絡(luò)拓?fù)洹_@些硬功夫,仍然是少數(shù)頭部云廠商的護(hù)城河。

同樣跑 DeepSeek-R1,頭部云廠商的推理效率可以比企業(yè)自建高出 3 到 5 倍。這意味著同等算力投入下,云廠商能服務(wù)更多并發(fā),單位成本更低。

這個(gè)效率差,就是云廠商 " 溢價(jià) " 的來源之一。它是實(shí)實(shí)在在的工程壁壘。所以這次漲價(jià),某種程度上也是在給自己的技術(shù)優(yōu)勢定價(jià)。

03. 諸神之戰(zhàn):四家巨頭的賬本與野心

在這一輪集體調(diào)價(jià)的浪潮中,四家核心巨頭的姿態(tài)各異,折射出不同的商業(yè)算盤。

阿里云:吳泳銘式的 " 利潤質(zhì)量 " 保衛(wèi)戰(zhàn)。阿里的調(diào)價(jià)最堅(jiān)決,漲幅主要集中在高端 GPU 實(shí)例和存儲(chǔ)(CPFS)上。在阿里全面回歸 " 效率第一 " 的背景下,阿里云不再追求所謂的 " 云市場份額第一 ",而是要搶奪 "AI 算力利潤率第一 "。潛臺(tái)詞就是,阿里云正在建立一個(gè) "VIP 算力區(qū) "。如果你無法覆蓋這 30% 的溢價(jià),你可能就不在阿里的核心目標(biāo)客戶名單上。

百度智能云:" 用戶過濾器 "。百度作為最早押注大模型的玩家,正面臨文心大模型推理成本隨調(diào)用量量級(jí)躍遷的壓力。所以百度的漲價(jià)更像是一場 " 用戶洗牌 "。它在主動(dòng)洗掉那些只薅羊毛、不產(chǎn)生商業(yè)閉環(huán)的小型個(gè)人開發(fā)者,轉(zhuǎn)而全力服務(wù)對(duì)價(jià)格不敏感的 B 端大客戶。百度需要通過調(diào)價(jià)證明:它的 AI 增長不再靠補(bǔ)貼,而是靠 " 溢價(jià)賣智力 "。

騰訊云:生態(tài)鎖死后的 "ROI 修正 "。騰訊云的動(dòng)作比阿里晚了三周,這是一種典型的 " 跟隨策略 "。騰訊的底氣在于微信生態(tài)和企業(yè)微信的深度綁定。當(dāng)企業(yè)的工作流已經(jīng)深度嵌入騰訊的社交 / 協(xié)同生態(tài),遷移成本極高。騰訊云的漲價(jià)更像是一種 " 補(bǔ)漲 ",用來修正過去兩年為了搶占生態(tài)而犧牲的 ROI,讓 AI 業(yè)務(wù)在財(cái)報(bào)里變得更 " 體面 "。

火山引擎:戰(zhàn)略性 " 不平衡跟隨 " 與搶人計(jì)劃。火山引擎(字節(jié)跳動(dòng))是這波漲價(jià)潮中的變數(shù)。它雖然也調(diào)整了部分價(jià)格,但在很多核心 API 上的漲幅明顯低于阿里和百度。字節(jié)正在利用這個(gè)窗口期進(jìn)行 " 存量截流 "。憑借內(nèi)部抖音、TikTok 帶來的恐怖算力消納能力,火山擁有極強(qiáng)的成本攤薄底牌。當(dāng)對(duì)手在 " 趕客 " 保利潤時(shí),火山在等那些掉隊(duì)者,試圖通過價(jià)格差完成最后一次 " 裝機(jī)量 " 的反超。

04. 最大的意外:大企業(yè)開始 " 出走 "

這次漲價(jià)引發(fā)了一個(gè)沒人預(yù)料到的反作用力:它實(shí)質(zhì)上堅(jiān)定了大企業(yè) " 自建算力 " 的決心。

云計(jì)算行業(yè)有個(gè)隱藏規(guī)律:當(dāng)月度賬單突破某個(gè)閾值," 自建 vs. 租用 " 的財(cái)務(wù)模型就會(huì)翻轉(zhuǎn)。對(duì)于銀行、央國企、大型制造商來說,這個(gè)閾值大約在每月 300 萬到 500 萬元的云算力支出。

2024 年,大多數(shù)大型企業(yè)還在閾值以下,自建劃不來。2025 年隨著 AI 項(xiàng)目鋪開,部分企業(yè)開始觸線。而 2026 年這輪 20% 到 30% 的漲價(jià),直接把一批原本剛好卡線的客戶,推到了 " 必須認(rèn)真考慮自建 " 的區(qū)間。

這波自建潮的受益者并不是云廠商的競爭對(duì)手,而是更邊緣的角色:GPU 租賃平臺(tái)的 3 月詢價(jià)量同比翻了兩倍;華為昇騰的大客戶交付排期已拉長到 6 個(gè)月;專門幫企業(yè)做 " 私有化推理集群 " 的集成商突然成了香餑餑。

云廠商本來打算漲價(jià)收割高端客戶,沒想到順手推走了一批有自建能力的大客戶。這個(gè)決策風(fēng)險(xiǎn),在財(cái)報(bào)季到來時(shí)可能會(huì)被重新評(píng)估。

05. 誰贏了?利益分配的真相

三家云廠商的漲價(jià),在媒體眼里是 " 大廠收割 "。但從整個(gè)產(chǎn)業(yè)鏈來看,真正的贏家分布要復(fù)雜得多。

這里有個(gè)諷刺的現(xiàn)實(shí):最受傷的是那些最有創(chuàng)新活力的中小 AI 創(chuàng)業(yè)公司。他們?nèi)绻驗(yàn)槌杀敬竺娣e倒下,云廠商自己的生態(tài)也會(huì)隨之枯萎。

這不是沒有先例。2010 年代初期,亞馬遜 AWS 在某些服務(wù)上的激進(jìn)漲價(jià),加速了部分開發(fā)者轉(zhuǎn)向 Google Cloud,間接幫助 GCP 完成了早期生態(tài)積累。歷史不會(huì)簡單重復(fù),但它會(huì)押韻。

06. 漲價(jià)時(shí)代,還要持續(xù)多久?

說穿了,這輪漲價(jià)的本質(zhì)是中國 AI 算力市場在需求爆發(fā)與供給約束之間的一次壓力釋放。兩邊擠壓之下,價(jià)格只能向上走。這不完全是云廠商的主動(dòng)選擇,某種意義上也是被迫的定價(jià)修復(fù)。

支撐這輪漲價(jià)的三個(gè)結(jié)構(gòu)性因素,沒有一個(gè)會(huì)在 12 個(gè)月內(nèi)實(shí)質(zhì)性消失:Reasoning 模型普及帶來的 Token 消耗量級(jí)躍遷、AI Agent 大規(guī)模落地加速、以及 Nvidia 出口管制帶來的供給約束。

B2B 軟件市場有一個(gè)反復(fù)驗(yàn)證的規(guī)律:價(jià)格棘輪效應(yīng)(Ratchet Effect)。AWS 在 2010 年代初的幾次漲價(jià),沒有一次在供給改善后完整回吐。Google Cloud 存儲(chǔ)定價(jià)自 2021 年以來只走過一次下行臺(tái)階,還附帶了存儲(chǔ)上限收緊。云廠商懂這個(gè)規(guī)律:這次漲價(jià)不只是 " 趁窗口收割 ",更是在鎖定一個(gè)新的價(jià)格基準(zhǔn)線。

所以在 2027 年之前," 算力歸零 " 不會(huì)成真。真正決定價(jià)格拐點(diǎn)的,取決于國產(chǎn)算力的調(diào)度效率什么時(shí)候能實(shí)質(zhì)性追上 Nvidia H100。從目前的工程進(jìn)度來看,這個(gè)時(shí)間點(diǎn)大概率在 2027 年至 2028 年之間。

而在這個(gè)窗口里,云廠商有充分的理由 " 先漲為敬 ",因?yàn)樗麄冎?,窗口不?huì)永遠(yuǎn)開著。

07 結(jié)語:一場供給側(cè)的結(jié)構(gòu)性博弈

這輪漲價(jià)揭示的,不是 "AI 商業(yè)化成人禮 " 這種宏大敘事,而是一個(gè)更具體的產(chǎn)業(yè)現(xiàn)實(shí):效率革命與需求爆炸同步發(fā)生時(shí),價(jià)格不一定下行,反而可能上行。杰文斯悖論在煤炭時(shí)代成立,在算力時(shí)代同樣成立。

對(duì)中小 AI 應(yīng)用企業(yè)來說,與其爭論誰在收割,不如認(rèn)真算一筆賬:自己的業(yè)務(wù)場景里,還有多少 Token 在被無效消耗?

省 Token,才是這個(gè)時(shí)代最硬的護(hù)城河。

相關(guān)標(biāo)簽

最新評(píng)論

沒有更多評(píng)論了

覺得文章不錯(cuò),微信掃描分享好友

掃碼分享

熱門推薦

查看更多內(nèi)容

企業(yè)資訊

查看更多內(nèi)容