文 | 字母 AI
25 歲的洪樂潼,最近在硅谷火了。
這個來自廣東的女孩,17 歲考入 MIT,三年修完數(shù)學和物理雙學位,后來又進入斯坦福深造。
按照硅谷最熟悉的那套敘事,她是 " 天才少女創(chuàng)業(yè)者 " 的模板人物。
但洪樂潼真正讓人記住的,不是履歷,而是她做的事太反常識。
當整個 AI 行業(yè)都在追逐更大的模型、更強的生成能力、更像人的表達時,她偏偏轉(zhuǎn)身去做了一件最不性感、也最難商業(yè)化的事:用數(shù)學驗證 AI。
她創(chuàng)辦的公司叫 Axiom,成立不足兩年,員工只有 20 多人,最近拿下 2 億美元 A 輪融資,投后估值高達 16 億美元,折合人民幣超 110 億元。
Axiom 不做聊天機器人,不做文生圖,也不跟風大語言模型的熱潮。它做的是 " 形式化驗證 "。
說白了,就是想用數(shù)學和邏輯,把 AI 每一步推理都變成可以檢查、可以證明、可以追責的東西。
這聽起來很冷門,但它瞄準的,卻是大模型最麻煩的軟肋——幻覺。
現(xiàn)在的 AI 最大的問題不是不夠強,而是不夠可靠。它可以把答案說得很像對的,甚至真的做對題,但你沒法確認它到底是真的推出來了,還是只是 " 猜對了 "。而 Axiom 要做的,就是把這種模糊狀態(tài),變成一種可驗證的確定性過程。
這也是為什么,當洪樂潼拿著這個想法去融資時,迎面撞上的不是掌聲,而是一個極其現(xiàn)實的問題:" 數(shù)學怎么賺錢?"
01 迎難而上的天才少女
洪樂潼的辦公室在硅谷帕洛阿爾托大學大道,距離斯坦福大學步行只要半個小時。斯坦福是她博士生涯的起點,但學位還沒有念完,她就退學創(chuàng)業(yè)了。
事實上,早在博士在讀期間,洪樂潼就已經(jīng)注冊了公司。公司取名 Axiom,名字源自數(shù)學術語 " 公里 "," 我想從公理出發(fā),打造一個能夠自我改進的超級智能推理器。"

憑什么?
要知道現(xiàn)有的大模型本質(zhì)上是概率黑盒,通過海量數(shù)據(jù)學習模式,然后基于統(tǒng)計規(guī)律給出答案。推理過程無法被量化,所以會胡說、會出錯。
洪樂潼要做的就是用數(shù)學公理和形式化驗證,讓 AI 每一步推理都可證明,可以直接面向金融、軍工、芯片和自動駕駛等對可靠性要求極高的市場。
她做的事顯然擊中了 AI 最大痛點,解決幻覺與可靠性的問題。
更何況,早期投資投人,她本人也是不折不扣的跨學科天才學霸。
洪樂潼從小就展現(xiàn)出了驚人的數(shù)學天賦。2001 年,她出生于廣州市天河區(qū),曾就讀于華南師大附中。高一時,她就在全國數(shù)學奧林匹克選拔賽中晉級,并在華羅庚杯、全國高中數(shù)學聯(lián)賽中屢獲佳績。
正是在奧數(shù)集訓中,她對研究型數(shù)學產(chǎn)生了興趣。
2018 年,17 歲的她被 MIT 錄取,3 年就修完了數(shù)學和物理雙學位,不僅發(fā)表了 9 篇學術論文,還獲得全美女性數(shù)學家最高榮譽 Alice T. Schafer 數(shù)學獎等諸多榮譽。
此后,她獲得牛津大學羅德獎學金,她沒有繼續(xù)深耕數(shù)學,轉(zhuǎn)頭去學了神經(jīng)科學,因為想 " 構(gòu)建跨越科學領域的認知體系 "。
基于這一目標,她同時在倫敦大學學院蓋茨比計算神經(jīng)科學中心開展深度學習研究,該中心由 " 深度學習之父 " 杰弗里 · 辛頓聯(lián)合創(chuàng)立。也正是在此期間,她正式踏足 AI 領域,接觸到許多最前沿的課題。隨后她又進入斯坦福大學,攻讀數(shù)學與法律雙學科博士。
2024 年,ChatGPT o3 被曝光在數(shù)學測試中存在 " 作弊 " 嫌疑,全球輿論嘩然。
作為斯坦福數(shù)學博士的洪樂潼也在社交媒體上發(fā)表了看法:"OpenAI 大模型在數(shù)學測試中表現(xiàn)優(yōu)秀,大概率是因為訓練數(shù)據(jù)中提前泄題了。在一些測試中,大模型回答的準確率雖然高達 96%,但一旦展示推理過程,得分率就降至 5%。"
面對行業(yè)痛點,一種名為 Lean 的語言闖入她的視線,也讓她嗅到了創(chuàng)業(yè)機會。
與自然語言不同,Lean 語言是一個非常神奇的、可以自驗證的數(shù)學編程語言。洪樂潼打了個比方:" 如果用英語寫出數(shù)學證明,我沒辦法知道一個 5000 行的證明是否正確,需要找高水平的專家驗證。但 Lean 是自驗證的,只要跑通了就是對的。"
Lean 的邏輯是把自然語言或非形式化驗證,轉(zhuǎn)成機器可檢查的形式化驗證。
那啥是形式化驗證呢?
普通的 AI,你只能用它的答案來判斷它是不是理解這個問題,但你不知道它中間有沒有瞎蒙。
形式化驗證是要求你把每一步都寫成機器能檢查的邏輯鏈條。只要中間有一步跳了、糊了、偷懶了,它就不給過。
之所以形式化驗證能治大模型會幻覺,是因為形式化驗證不管你答案如何,只要你的結(jié)論是從前提里一步步合法推出來的,那答案就是對的,從而避免了模型產(chǎn)生幻覺。
所以 Axiom 做的,就是讓大模型負責猜想和搜索,讓 Lean 負責驗算和判斷。如果 Lean 檢查發(fā)現(xiàn)過程不對,那就退回去繼續(xù)改。
但這顯然是一條窄路。這條路冷門到什么程度?在整個 AI 版圖里,形式化驗證幾乎是邊緣中的邊緣,全球的商業(yè)化玩家一只手就數(shù)得過來。
顯然她并不是因為形式化驗證是下一個風口才選的,而是因為她對 " 困難 " 的定義和別人不一樣。
奧賽就像持續(xù)釋放多巴胺的快感,而研究型數(shù)學像在撞墻,充滿痛苦與煎熬。我其實特別喜歡這種挑戰(zhàn)感。" 她曾這樣解釋自己癡迷數(shù)學的原因。
正是這種刻在骨子里的挑戰(zhàn)欲,讓她不愿再停留在學術研究的舒適區(qū),渴望在更廣闊的戰(zhàn)場上去攻克 AI 領域的硬骨頭。
2024 年深秋,斯坦福附近的一家咖啡館里,洪樂潼與當時 Meta AI 研究總監(jiān) Shubho Sengupta 聊了整整幾個小時,核心議題只有一個:AI 能不能真正學會數(shù)學推理?
兩人一拍即合,一個退學,一個辭職,兩人一起創(chuàng)業(yè)。
02 一支 " 草根 " 工程師軍團
Axiom 只有 20 多名員工,洪樂潼用了一個詞來形容團隊的氣質(zhì):草根工程師精神。
但事實上,這支團隊的成員身份一點也不草根,甚至背景堪稱豪華。
Axiom 第一位成員,正是和她在咖啡館聊了好幾個小時的 Meta 前員工 Shubho Sengupta,如今他的身份是公司的 CTO。
核心科學家 Fran ois Charton,則是將 Transformer 架構(gòu)引入數(shù)學推理領域的先驅(qū)人物。他干的活,就是把數(shù)學算式當成一種 " 語言 " 輸入進 Transformer,試試看 Transformer 能不能像翻譯句子一樣去翻譯數(shù)學。
其他成員約半數(shù)來自 Meta AI,另一半則是世界級數(shù)學家與形式化驗證先驅(qū)。
而最讓外界震驚的一位成員,是 57 歲的數(shù)學泰斗小野?。↘en Ono)。
他是模形式領域的頂尖學者,美國數(shù)學學會前副會長,拿過古根海姆獎、斯隆獎等榮譽。指導過的學生中有十位摩根獎得主。他還曾為美國奧運游泳隊提供數(shù)據(jù)分析,為電影《知無涯者》擔任顧問。
這位弗吉尼亞大學終身教授與洪樂潼結(jié)緣于麻省理工。彼時大一新生洪樂潼參與了他的數(shù)論項目。師生關系延續(xù)至今,角色卻已不同,2025 年底,小野健辭去教職,全職加入 Axiom,成為第 15 號員工。
曾拒絕過 Google 和 Meta 邀請的小野健,為什么愿意為一個 24 歲的學生 " 打工 "?
" 如果我的猜想能被機器在 3 天內(nèi)推廣到 10 個維度,我愿意當一個‘標注工’。" 小野健曾公開表示,他選擇幫自己的學生打工,不僅因為洪樂潼開出 " 不設教學、不設行政、100% 科研 " 的合約,更關鍵的是,AI 對他的 " 降維打擊 ",讓他感到興奮。
一群頂級學者和前 Meta 成員,這個團隊哪里草根了?
洪樂潼的解釋是,草根,代表著始終 " 空杯 " 的心態(tài)和堅韌的品質(zhì)。在創(chuàng)業(yè)這條路上,即使是資深 " 牛人 ",也要從頭學起,不斷自我革新。
她自己最喜歡的不是當 " 精英 ",而是做 " 草根 ",做個 nobody(小人物),這樣學習的坡度最陡、速度最快。
她自己也是 " 草根精神 " 的踐行者,在被問到如何帶領團隊時,洪樂潼說:" 我其實不太喜歡用帶領這個詞。我希望自己是一個 Individual contributor(獨立貢獻者),每個人都是,這是一群志同道合的人在一起做事。"
" 我們創(chuàng)立 Axiom,就是要無限壓縮把好奇心轉(zhuǎn)化為真理的時間 ",在資本驅(qū)動的硅谷,洪樂潼的這種純粹性,對于頂尖研究者而言,或許比一份高薪 offer 更有吸引力。
這支不到 20 人的團隊,在成立后不到一年就交出了一份令人意外的答卷。
2025 年 12 月 3 日,Axiom 宣布其核心系統(tǒng) AxiomProver 在無人干預的情況下,攻克了困擾數(shù)學界數(shù)十年的兩道埃爾德什難題。
同一天,洪樂潼收到了入選 " 福布斯 30 歲以下 30 人 " 榜單的消息。
同月,AxiomProver 又在普特南數(shù)學競賽中斬獲滿分,12 道題全對。普特南是北美最負盛名的大學生數(shù)學競賽,成績的中位數(shù)常常為零,過去近百年僅有 5 個人類選手拿到過滿分。
Axiom 進一步印證了用形式化驗證構(gòu)建可靠、可核驗、無幻覺的 AI,已是行業(yè)明確的重要方向,而 AxiomProver 則在這條路徑上交出了可復現(xiàn)、高難度的實證。
03 賽道升溫,但挑戰(zhàn)剛剛開始
從行業(yè)發(fā)展來看,洪樂潼的選擇正好踩在了技術轉(zhuǎn)折點上。
2024 年年底,Meta FAIR 和斯坦福大學等多所機構(gòu)聯(lián)合發(fā)布了一篇立場論文《Formal Mathematical Reasoning: A New Frontier in AI》。
論文給出了這樣一個判斷,過去的 AI 數(shù)學就是喂很多數(shù)學題,再讓模型輸出答案。這就導致數(shù)據(jù)會污染、過程會胡編,AI 沒辦法自判斷對錯,并且還很難復現(xiàn)過程。
這顯然是路走錯了。就拿乘法口訣表來說,里面寫的是 2*3 得 6,那么你自己也能理解 3*2 就也得 6。這個過程就叫復現(xiàn)。
論文主張的是下一步要把證明助手、形式系統(tǒng)、自動驗證真正接進模型里來,讓 AI 真正懂數(shù)學。
但這也意味著這條窄路正在變得擁擠。
過去十年,AI 賽道的主流敘事是 " 更大參數(shù)、更多數(shù)據(jù)、更快生成 ",所有大公司都在這條路上狂奔。洪樂潼選擇的形式化驗證是其中冷門到幾乎沒有競爭的賽道。
今年年初,Meta 也發(fā)布了半形式化推理技術,讓大語言模型能夠在不執(zhí)行代碼的情況下驗證代碼補丁,準確率高達 93%。競品公司 Harmonic 在今年 1 月獲得了英偉達投資,估值達 14.5 億美元,產(chǎn)品已擴展到代碼編寫和芯片設計領域。Theorem、Axiomatic AI、Cajal 等一批初創(chuàng)公司,也在近兩年紛紛進入這個賽道。
對 Axiom 而言,挑戰(zhàn)遠不止行業(yè)競爭。
最大的挑戰(zhàn)在于商業(yè)模式。洪樂潼最初的設想是將產(chǎn)品服務于對沖基金和量化交易公司,快速解決與資產(chǎn)定價、股市預測相關的復雜數(shù)學問題。
但這個藍圖至今仍停留在構(gòu)想階段。對高頻交易而言,比 " 正確 " 更重要的是 " 足夠快 ",毫秒級的延遲可能比一次罕見錯誤帶來更大損失。
Axiom 的絕對正確性,在追求速度的金融場景中,其實際價值目前仍需要打一個問號。另一個挑戰(zhàn),則在于除了對價格不敏感的航空航天、國防軍工等少數(shù)領域,其他絕大多數(shù)企業(yè)愿意為 " 絕對正確 " 支付高溢價嗎?
洪樂潼自己也承認這一點:" 數(shù)學怎么賺錢?我們從一開始就面臨這個挑戰(zhàn)。" 但她認為," 現(xiàn)在,商業(yè)信號已經(jīng)清晰很多,數(shù)學能創(chuàng)造價值,是因為它能自我驗證、自我檢查。"
另一方面,高估值本身也是一把雙刃劍。16 億美元的 A 輪估值意味著,投資人期望的是超高速的增長和明確的退出路徑。
Axiom 必須在未來一到兩年內(nèi)證明其技術具備規(guī)?;虡I(yè)化的可能,否則下一輪融資將面臨巨大壓力。與此同時,它需要在巨頭和強勁對手的夾擊中,用更少的資源跑出更快的速度。
Axiom 的未來,更像是一場理想主義的壓力測試。 從 " 絕對正確 " 的技術理想,到 " 相對經(jīng)濟 " 的商業(yè)世界,Axiom 的挑戰(zhàn),才剛剛開始。