电竞比分网-中国电竞赛事及体育赛事平台

關(guān)于ZAKER 合作
鈦媒體 22分鐘前

AI 算力不能總為愛(ài)發(fā)電

文|商業(yè)秀,作者 | 羅小媚 編 | 楊肖若 張弘一

" 月均調(diào)用 API 超 15 萬(wàn)次每月 ",盯著團(tuán)隊(duì)開(kāi)發(fā)的 AI 客服 SaaS 工具后臺(tái)近三個(gè)月的 API 調(diào)用量和賬單,李然的眉頭緊鎖。

4 月 13 日,阿里云官網(wǎng)的一紙公告,更讓李然的心一沉。公告顯示,調(diào)整 DataWorks 標(biāo)準(zhǔn)版、專業(yè)版用戶的 API(應(yīng)用程序編程接口)免費(fèi)額度并支持按量付費(fèi)。DataWorks 標(biāo)準(zhǔn)版,調(diào)用 API 的免費(fèi)額度調(diào)整為 10 萬(wàn)次 / 月,超出部分采用 OpenAPI 按量付費(fèi)的方式。

這意味著,從 4 月 14 日政策生效起,每月至少 5 萬(wàn)次的超額調(diào)用,將讓李然這位 DataWorks 標(biāo)準(zhǔn)版的用戶,運(yùn)營(yíng)成本增加超 8000 元,而他背后的 AI 客服 SaaS 工具上月的凈利潤(rùn)剛過(guò)萬(wàn)。

" 算了一筆賬,這真的不是靠 AI 降本提效了。你看我們?nèi)ツ赀@時(shí)候,甚至還在為免費(fèi)調(diào)用量用不完發(fā)愁呢!" 李然笑著對(duì)我們調(diào)侃道。

2025 年同期,李然和他的創(chuàng)業(yè)項(xiàng)目調(diào)用 1000 萬(wàn) Token 的成本僅 500 元,而如今同樣的用量,如果說(shuō)再疊加騰訊云混元模型、百度文心的單價(jià)上調(diào),成本已飆升至近萬(wàn)元。

他說(shuō),自己的公司現(xiàn)金流還能再撐三個(gè)月,但成本一旦上漲,始終是有些壓力。

今年以來(lái)隨著 AI 的火爆,尤其是 2026 年春節(jié)以來(lái)的 OpenClaw(龍蝦)熱徹底改變了 Token 的消耗邏輯,像李然這樣的中小開(kāi)發(fā)者急需 Token 算力。

根據(jù)摩根大通曾預(yù)測(cè),中國(guó)的 AI 推理 Token 消耗量預(yù)計(jì)將從 2025 年的約 10 千萬(wàn)億增長(zhǎng)至 2030 年的約 3900 千萬(wàn)億,五年間增長(zhǎng)約 370 倍。

當(dāng)全球 AI 行業(yè)還在期待技術(shù)突破時(shí),一場(chǎng)由算力價(jià)格調(diào)整引發(fā)的成本考驗(yàn)也在降臨。最近國(guó)內(nèi)外 AI 和云服務(wù)廠商的價(jià)格調(diào)整動(dòng)作開(kāi)始愈發(fā)密集,根據(jù)公開(kāi)報(bào)道,阿里云已確認(rèn),從 4 月 18 日起,AI 算力、存儲(chǔ)等產(chǎn)品將全線漲價(jià),最高漲幅 34%。

從阿里、騰訊到 AWS、OpenAI,無(wú)一家缺席,甚至海外廠商的調(diào)整幅度比國(guó)內(nèi)更甚。這意味著,所有消費(fèi)者此前享受的 API 免費(fèi)調(diào)用服務(wù)大幅縮水,超出部分必須真金白銀買單,尤其是對(duì)像李然這樣高頻用戶來(lái)說(shuō),也會(huì)增加他們的調(diào)用 API 成本。

這讓無(wú)數(shù)中小開(kāi)發(fā)者正在重新審視這場(chǎng)由 AI 帶來(lái)的成本優(yōu)化競(jìng)賽。

01 一場(chǎng)全球范圍的算力調(diào)價(jià)

這場(chǎng)調(diào)整,其實(shí)是全球范圍內(nèi)的算力價(jià)值重估。

先看國(guó)內(nèi)廠商的調(diào)整路徑。最先調(diào)整的是百度智能云,3 月 18 日其官宣,4 月 18 日起 AI 算力相關(guān)產(chǎn)品價(jià)格上調(diào) 5%-30%,文心一言系列 API 單價(jià)上調(diào) 12%-25%,取消低階模型的 " 永久免費(fèi)不限量 ",改為 QPS 限流 + 超額計(jì)費(fèi)。

這被業(yè)內(nèi)認(rèn)為是算力補(bǔ)貼時(shí)代的結(jié)束,畢竟過(guò)去靠免費(fèi)額度吸引的中小開(kāi)發(fā)者,如今需按實(shí)際用量付費(fèi)。

緊隨其后的是騰訊云,3 月調(diào)整混元模型 API 價(jià)格,4 月 9 日騰訊云正式發(fā)布價(jià)格調(diào)整公告,宣布將于 5 月 9 日起對(duì) AI 算力、容器服務(wù) TKE- 原生節(jié)點(diǎn)及彈性 MapReduce(EMR)相關(guān)產(chǎn)品刊例價(jià)統(tǒng)一上調(diào) 5%。

字節(jié)火山引擎的調(diào)整相對(duì)隱蔽一些,Q1 豆包 LLM Token 單價(jià)調(diào)整,文生視頻 API 價(jià)格較內(nèi)測(cè)期上漲,單 15 秒視頻成本約 15 元,同時(shí)取消無(wú)限免費(fèi)調(diào)用,僅保留新用戶 500 萬(wàn) Token/30 天的短期額度。

智譜 AI 的調(diào)整最為頻繁。幾乎智譜的每次發(fā)布模型都伴隨著價(jià)格上漲。4 月 8 日,智譜發(fā)布旗艦開(kāi)源模型 GLM-5.1,同時(shí)智譜 GLM 系列 API 價(jià)格再度上調(diào) 10%,直逼 Anthropic。本月 12 日,智譜 Coding Plan(海外版)漲價(jià),月付價(jià)格幾乎翻倍,這已經(jīng)是智譜今年第三次提價(jià)了。

在 3 月 31 日的業(yè)績(jī)電話會(huì)上,智譜 CEO 張鵬表示,2026 年第一季度智譜的 API 調(diào)用定價(jià)提升 83%,即便如此,市場(chǎng)依然呈現(xiàn)出供不應(yīng)求的情況,調(diào)用量增長(zhǎng) 400%。

算力雖貴,但也在印證一個(gè)事實(shí),那就是 AI 已從可選工具變成了企業(yè)的剛需生產(chǎn)資料,用戶對(duì)價(jià)格的敏感度卻低于對(duì)模型能力的需求。

海外廠商的調(diào)整也來(lái)勢(shì)洶洶。1 月 22 日,亞馬遜 AWS 打破 20 年 " 價(jià)格下行 " 慣例,上調(diào) EC2 機(jī)器學(xué)習(xí)容量塊價(jià)格 15%;2 月 15 日,微軟 Azure 調(diào)整 GPT-4o、GPT-4 Turbo API 價(jià)格,取消 GPT-4o 免費(fèi)額度;3 月 10 日,Google Cloud 官宣 5 月 1 日起 AI 計(jì)算實(shí)例價(jià)格調(diào)整,下架 Gemini 低價(jià)訂閱套餐;OpenAI 則調(diào)整 GPT-4o/4 Turbo API 價(jià)格,ChatGPT Plus 從 20 美元 / 月漲至 30 美元 / 月,每日消息限 30 條。

從國(guó)內(nèi)到海外,從算力實(shí)例到 API 調(diào)用,這場(chǎng)全球范圍內(nèi)的集體調(diào)價(jià),硬是把 AI 產(chǎn)業(yè)從補(bǔ)貼擴(kuò)張階段拉回到了價(jià)值定價(jià)的理性軌道。免費(fèi)額度成為過(guò)去,按量付費(fèi)才是常態(tài),開(kāi)發(fā)者們是時(shí)候需重新算一筆賬,評(píng)估成本結(jié)構(gòu)了。

02 調(diào)整背后的邏輯

全球廠商們集體調(diào)整價(jià)格,逐利是表面的,本質(zhì)上還是 AI 產(chǎn)業(yè)從擴(kuò)張期進(jìn)入盈利驗(yàn)證期的必然?!干虡I(yè)秀」認(rèn)為,這場(chǎng)全球范圍的調(diào)整背后藏著 3 個(gè)底層邏輯。

首先,最核心的底層邏輯是算力價(jià)值重估。

隨著 AI 的核心燃料(GPU、HBM)的供給緊張,成本上漲,也就倒逼所有下游廠商調(diào)整價(jià)格。而這一切的起點(diǎn),或許要回到英偉達(dá)來(lái)看。

目前英偉達(dá)占據(jù)全球 85% 的 AI 芯片市場(chǎng)份額,凈利潤(rùn)率高達(dá) 56%,可以說(shuō),在很大程度上,它的定價(jià)直接決定了整個(gè)行業(yè)的成本底線。

2026 年,英偉達(dá) Blackwell 系列 GPU 交付周期排至 2027 年,單卡采購(gòu)成本同比上漲 30% 以上。而 HBM3E 高帶寬內(nèi)存現(xiàn)貨價(jià)較 2025 年底上漲超 20%,全球產(chǎn)能缺口 50%-60%,甚至出現(xiàn)供應(yīng)緊張的局面。

更重要的是,英偉達(dá)通過(guò)硬件 + 軟件的閉環(huán)生態(tài),進(jìn)一步拉高了行業(yè)的成本。全球 90% 的 AI 訓(xùn)練代碼基于 CUDA 編寫,500 萬(wàn)開(kāi)發(fā)者都依賴這家巨頭的生態(tài),每顆 H20 芯片就要搭配 1.2 萬(wàn)美元的 CUDA 授權(quán)費(fèi),隱性成本占比就超過(guò)了 30%。

這種從性能到成本的雙重影響,也讓阿里、騰訊、微軟、谷歌等廠商們只能被動(dòng)接受成本上漲,繼而再將壓力傳導(dǎo)給下游用戶。

如果說(shuō),算力成本上漲是被動(dòng)調(diào)整的理由,那么 Token 需求的指數(shù)級(jí)增長(zhǎng),就是廠商們主動(dòng)調(diào)整的底氣。

2026 年,AI 應(yīng)用從單輪對(duì)話進(jìn)入到了智能體時(shí)代,隨之而來(lái)的是 Token 消耗呈現(xiàn)指數(shù)級(jí)的增長(zhǎng)。以 OpenClaw 等 Agent 為例,它的單任務(wù)多輪遞歸、工具調(diào)用和反思驗(yàn)證,光是 Token 消耗,就已經(jīng)是傳統(tǒng)對(duì)話的 50 到 100 倍,單個(gè)活躍 Agent 月耗 Token 可以達(dá)到普通用戶的千倍以上。

數(shù)據(jù)顯示,2026 年一季度國(guó)內(nèi)日均 Token 調(diào)用量突破 140 萬(wàn)億,較 2024 年初的 1000 億增長(zhǎng)超過(guò) 1400 倍。字節(jié)豆包日均 Token 消耗超過(guò) 120 萬(wàn)億,其中多模態(tài)(比如視頻 / 圖像)Token 占比超過(guò) 40%,成本是純文本的 10 倍以上。而百度千帆平臺(tái)企業(yè)用戶 Token 消耗 Q1 環(huán)比增長(zhǎng)了 280%。

目前算力的消耗狀態(tài)可以用一句話來(lái)形容,那就是低階免費(fèi)模型需求旺盛,高階付費(fèi)模型供不應(yīng)求。一旦需求增長(zhǎng),供給緊張,價(jià)格自然就由供需決定,這也就可以解釋為什么智譜價(jià)格調(diào)整后調(diào)用量反而增長(zhǎng) 400% 了。

由是觀之,高質(zhì)量 Token 成為稀缺資源。

當(dāng)然最根本的變化,還是整個(gè) AI 產(chǎn)業(yè)的商業(yè)邏輯變了。行業(yè)開(kāi)始從燒錢換規(guī)模、虧損換用戶,轉(zhuǎn)向了盈利優(yōu)先和精細(xì)化運(yùn)營(yíng),定價(jià)權(quán)從用戶端回歸廠商端。

過(guò)去兩年,整個(gè) AI 行業(yè)處于瘋狂擴(kuò)張的階段,大家的資本投入也多,廠商們靠著免費(fèi) API、低價(jià)算力吸引用戶從而占領(lǐng)市場(chǎng)。哪怕是 AI 業(yè)務(wù)持續(xù)虧損也無(wú)所謂,反正還有其他業(yè)務(wù)的利潤(rùn)支持,還有資本的資金來(lái)保障持續(xù)投入。

但是,進(jìn)入 2026 年,風(fēng)向就變了。資本投入趨于理性了,廠商們紛紛表示我們有盈利壓力了,畢竟大老板說(shuō)了:AI 業(yè)務(wù)必須給我盈利。

所以,這樣一來(lái),我們就能理解為什么阿里云調(diào)整免費(fèi)額度,開(kāi)啟按量付費(fèi),而騰訊云、百度智能云全鏈路調(diào)整價(jià)格。字節(jié)火山引擎則是利用內(nèi)部規(guī)模效應(yīng)降低成本,同時(shí)通過(guò)外部?jī)r(jià)格調(diào)整實(shí)現(xiàn) AI 業(yè)務(wù)盈利,海外的 OpenAI、Anthropic,則也通過(guò)價(jià)格調(diào)整兌現(xiàn)模型能力的價(jià)值。

參考亞馬遜 AWS 歷經(jīng) 14 年的奮斗才跨過(guò)盈虧平衡點(diǎn),阿里云則在 2022 年走向盈利。國(guó)內(nèi)云廠商的價(jià)格戰(zhàn),早在 2014 年便已拉開(kāi)帷幕,此后十余年間從未停歇,阿里云常年主動(dòng)發(fā)起大規(guī)模降價(jià),單次最高降幅超 50%,而騰訊云則始終快速跟進(jìn),甚至祭出比阿里云更低的報(bào)價(jià),展開(kāi)貼身肉搏式競(jìng)爭(zhēng)。

據(jù)公開(kāi)報(bào)道,騰訊云在過(guò)去很長(zhǎng)一段時(shí)間里被視為集團(tuán)的成本中心。為了在阿里云和華為云的激烈競(jìng)爭(zhēng)中快速搶占市場(chǎng)份額,騰訊云長(zhǎng)期采取了激進(jìn)的低價(jià)策略,通過(guò)遠(yuǎn)低于成本的報(bào)價(jià)和長(zhǎng)期不漲價(jià)的承諾來(lái)獲取大客戶訂單。

而這種策略,雖然讓騰訊云的營(yíng)收規(guī)模快速做大,一度坐穩(wěn)國(guó)內(nèi)第二,但也會(huì)導(dǎo)致業(yè)務(wù)長(zhǎng)期處于規(guī)模不經(jīng)濟(jì)的怪圈,也就是規(guī)模越大,虧損可能越嚴(yán)重。直到2025 年,騰訊云業(yè)務(wù)才實(shí)現(xiàn)了全年規(guī)模化盈利。

毋庸置疑的是,隨著 AI 算力需求的上漲,市場(chǎng)規(guī)模越來(lái)越大。但是,絕大多數(shù)云廠商卻依舊是常年處于虧損狀態(tài)。目前這幾家除了市值突破 4000 億港元的智譜,有資本底氣來(lái)繼續(xù)抬高價(jià)格,繼續(xù)折騰,其他家?guī)缀踹€在垂死掙扎。

在這樣的大環(huán)境下,更不要說(shuō)中小企業(yè)的生存了。

03 成本增加和賬單反思

" 我們這種小團(tuán)隊(duì),沒(méi)有自研模型,沒(méi)有算力儲(chǔ)備,只能依賴公有云 API。" 李然的聲音里透著一絲無(wú)奈," 成本上漲后,要么調(diào)整價(jià)格,要么壓縮利潤(rùn)。"

更現(xiàn)實(shí)的是,廠商們會(huì)把算力資源,優(yōu)先分配給付費(fèi)率高、用量大、毛利高的客戶比如金融、政企、頭部互聯(lián)網(wǎng)企業(yè)等,中小企業(yè)不僅會(huì)增加成本,還可能面臨資源分配的問(wèn)題,獲取穩(wěn)定算力的難度也會(huì)有所增加。

這背后最受影響的反而是那些套殼應(yīng)用,也就是沒(méi)有任何技術(shù)壁壘,只是簡(jiǎn)單調(diào)用 API 做二次開(kāi)發(fā)的企業(yè)和平臺(tái)。" 一旦成本上漲,它們的成本優(yōu)勢(shì)減弱,那就需要重新審視商業(yè)模式了。" 前述投資人告訴「商業(yè)秀」。

對(duì)個(gè)人開(kāi)發(fā)者來(lái)說(shuō),免費(fèi)額度的調(diào)整同樣也會(huì)帶來(lái)影響,因?yàn)榱愠杀驹囧e(cuò)的窗口關(guān)閉了。百度調(diào)整低階模型的免費(fèi)額度、字節(jié)調(diào)整豆包的免費(fèi)額度,僅保留新用戶短期額度(百度 100 萬(wàn) /90 天、字節(jié) 500 萬(wàn) /30 天)。

是時(shí)候需重新規(guī)劃成本投入了。這種賬單反思,也正在倒逼開(kāi)發(fā)者從無(wú)腦調(diào)用轉(zhuǎn)向精打細(xì)算,開(kāi)始研究模型壓縮、量化、上下文窗口優(yōu)化、RAG 檢索增強(qiáng),甚至說(shuō)混合調(diào)用不同版本模型,這些只是為了降低 Token 消耗。

不過(guò),這也需要時(shí)間和技術(shù)積累,對(duì)于很多中小團(tuán)隊(duì)來(lái)說(shuō),當(dāng)務(wù)之急是重新規(guī)劃公司的發(fā)展路徑。李然決定看看研究一下各家的套餐," 組合疊加使用起來(lái),會(huì)更劃算。"

可以看到的是,這場(chǎng)價(jià)格調(diào)整,正在加速 AI 產(chǎn)業(yè)的分化。頭部企業(yè)憑借全棧能力與規(guī)模效應(yīng),調(diào)整后仍能保持毛利,甚至通過(guò)資源優(yōu)化進(jìn)一步鞏固市場(chǎng)份額。而中小廠商,尤其是無(wú)自研模型、無(wú)算力儲(chǔ)備的中小 AI 服務(wù)商,成本增加無(wú)法傳導(dǎo),利潤(rùn)受到影響,需重新尋找發(fā)展路徑。

不過(guò),也會(huì)有例外,那些深耕垂直場(chǎng)景、有核心技術(shù)(如模型優(yōu)化、成本管控)的中小廠商,反而可能在這場(chǎng)調(diào)整中跑出來(lái)。它們不需要依賴高端 API,只要能在垂直場(chǎng)景中實(shí)現(xiàn)降本增效,就能找到自己的出路。

相信有很多人關(guān)注這場(chǎng)價(jià)格調(diào)整,有人認(rèn)為廠商們逐利,讓中小企業(yè)和開(kāi)發(fā)者面臨成本壓力。但「商業(yè)秀」認(rèn)為,這場(chǎng)調(diào)整也預(yù)示著 AI 產(chǎn)業(yè)正在走向成熟。畢竟,過(guò)去兩年免費(fèi) AI 的補(bǔ)貼模式,讓很多人誤以為 AI 是免費(fèi)的,也催生了大量無(wú)價(jià)值的應(yīng)用,浪費(fèi)了算力資源。而 2026 年的這場(chǎng)集體調(diào)整,本質(zhì)上是市場(chǎng)在優(yōu)化和淘汰無(wú)價(jià)值的應(yīng)用,倒逼技術(shù)迭代。只有這樣,才能讓真正有價(jià)值的 AI 應(yīng)用獲得合理的商業(yè)回報(bào)。

算力可以走普惠路線,可以追求性價(jià)比。但沒(méi)有廠商,能一直為愛(ài)發(fā)電。

這場(chǎng)調(diào)整對(duì)廠商們來(lái)說(shuō),也是商業(yè)邏輯的回歸。接下來(lái)可以用成本 + 合理利潤(rùn)定價(jià)來(lái)實(shí)現(xiàn) AI 業(yè)務(wù)的可持續(xù)盈利。對(duì)中小企業(yè)和開(kāi)發(fā)者來(lái)說(shuō),它們除了要控制自己的成本,更要轉(zhuǎn)向技術(shù)優(yōu)化和深耕垂直場(chǎng)景。

AI 從來(lái)都不是免費(fèi)午餐。未來(lái) AI 行業(yè)進(jìn)入價(jià)值付費(fèi)時(shí)代,只有真正能創(chuàng)造價(jià)值,做好成本管控的企業(yè)和開(kāi)發(fā)者,才能不被時(shí)代拋棄,站穩(wěn)腳跟活下去。

相關(guān)標(biāo)簽

相關(guān)閱讀

最新評(píng)論

沒(méi)有更多評(píng)論了

覺(jué)得文章不錯(cuò),微信掃描分享好友

掃碼分享

熱門推薦

查看更多內(nèi)容

企業(yè)資訊

查看更多內(nèi)容