在一場關(guān)乎地緣政治格局的激烈競爭中,美國與中國在 AI 領(lǐng)域的表現(xiàn)幾乎并駕齊驅(qū)。根據(jù)社區(qū)驅(qū)動的排名平臺Arena 數(shù)據(jù)顯示,2023 年初,OpenAI 憑借 ChatGPT 一度領(lǐng)先,但隨著谷歌和 Anthropic 在 2024 年推出各自的模型,這一優(yōu)勢逐漸被削弱。到 2025 年 2 月,中國實驗室 DeepSeek 開發(fā)的 AI 模型 R1 曾短暫追平美國頂尖模型 ChatGPT。截至 2026 年 3 月,Anthropic 占據(jù)領(lǐng)先地位,緊隨其后的是 xAI、谷歌和 OpenAI,而 DeepSeek 和阿里巴巴等中國模型僅小幅落后。

盡管美國在 AI 領(lǐng)域擁有更強大的資本支持和基礎(chǔ)設(shè)施優(yōu)勢——例如,其數(shù)據(jù)中心數(shù)量高達 5,427 個,遠超其他國家,但中國在 AI 研究論文發(fā)表量、專利申請數(shù)及機器人技術(shù)方面處于全球領(lǐng)先地位。
然而,隨著競爭加劇,像 OpenAI、Anthropic 和谷歌這樣的公司已不再公開其訓(xùn)練代碼、參數(shù)規(guī)?;驍?shù)據(jù)集細(xì)節(jié)。" 我們對如何預(yù)測模型行為仍知之甚少," 南加州大學(xué)計算機科學(xué)家 Yolanda Gil 指出," 這種透明度的缺失讓獨立研究人員難以探索如何提升 AI 的安全性。"
AI 模型發(fā)展速度驚人
盡管有人曾預(yù)測 AI 的發(fā)展將趨于平穩(wěn),但事實恰恰相反。這些模型在某些測試中的表現(xiàn)已經(jīng)達到甚至超越了人類專家水平,例如博士級別的科學(xué)、數(shù)學(xué)和語言理解能力評估。SWE-bench Verified 是一個針對 AI 模型的軟件工程基準(zhǔn)測試,其最高得分從 2024 年的約 60% 飆升至 2025 年的接近 100%。此外,2025 年一款 AI 系統(tǒng)成功實現(xiàn)了自主生成天氣預(yù)報。

不過,AI 在許多領(lǐng)域仍面臨挑戰(zhàn)。由于這些模型主要依賴海量文本和圖像進行學(xué)習(xí),而非通過物理世界的體驗,因此表現(xiàn)出 " 參差不齊的智能 "。例如,機器人技術(shù)尚處早期階段,在家庭任務(wù)中的成功率僅為 12%。相比之下,自動駕駛汽車進展較快:Waymo 已在五個美國城市投入運營,百度的 Apollo Go 車輛也在中國為乘客提供接送服務(wù)。此外,AI 正在向法律和金融等專業(yè)領(lǐng)域擴展,但尚未有任何模型能夠主導(dǎo)這些復(fù)雜場景。