谷歌在今年的 Android Show(I/O 版)上,說了一句聽起來有點(diǎn)夸張的話,Android 正從一個(gè) operating system,轉(zhuǎn)變?yōu)橐粋€(gè) intelligence system。

或許,以后我們?cè)僖膊恍枰?App 圖標(biāo)了。
這句話翻譯成人話,就是手機(jī)不再只是被動(dòng)等你點(diǎn)開 App 的工具,它開始主動(dòng)幫你把事情做完。谷歌給的例子很具體:你把一份購物清單記在備忘錄里,Gemini 可以讀出來,再去購物 App 里一項(xiàng)項(xiàng)加進(jìn)購物車;你讓它從 Gmail 里翻出某本教材的信息,它能找到之后直接幫你下單;你給它一張照片,它能在旅行平臺(tái)上替你搜對(duì)應(yīng)的行程。

不僅僅是手機(jī),按照谷歌的計(jì)劃,這項(xiàng)能力最早在三星 Galaxy 和 Pixel 上布局,隨后到手表、汽車、眼鏡和筆記本上。
但問題來了,當(dāng)手機(jī)開始替我們「干活」而不只是回應(yīng),App 那套我們用了十幾年的邏輯會(huì)被改寫嗎?以下是雷科技的看法。
過去的語音助手,用起來的感覺就是它只是一個(gè)會(huì)回應(yīng)你的小伙伴。比如你對(duì)著手機(jī)說「把我備忘錄里的購物清單加進(jìn)購物車」,過去的 Google Assistant 會(huì)怎么做?大概率是把這句話當(dāng)成一個(gè)搜索詞,打開瀏覽器,給你返回幾條相關(guān)鏈接,然后任務(wù)就結(jié)束了。
但在用戶的角度,肯定還是希望它能夠打開備忘錄、記住清單、切換到購物 App、一項(xiàng)項(xiàng)搜索、一項(xiàng)項(xiàng)加入,完全解放雙手。尷尬就在于,它聽懂了你的話,卻干不了你的事。

Android 開發(fā)者社區(qū)里有人復(fù)盤過谷歌早年的兩次嘗試,一個(gè)叫 Direct Actions API,要求 App 必須在前臺(tái)運(yùn)行助手才能操作,等于助手沒法自己后臺(tái)干活;另一個(gè)叫 Assist API,給了系統(tǒng)「看屏幕」的眼睛,卻沒給它「理解該怎么操作」的腦子,兩條路子都不太行。也就是說,其實(shí)大家對(duì)于語音助手只能回答不能干活這件事,早就有怨言。
Gemini Intelligence 想補(bǔ)上的,正是「手」和「腦」這兩塊。谷歌把這套能力叫做 Task Automation(任務(wù)自動(dòng)化),它能在用戶授權(quán)下,跨多個(gè)被選中的 App 完成多步驟任務(wù),并且全程保留透明度和用戶控制權(quán)。換句話說,你說一句話,它會(huì)讀清單、調(diào) App、加購物車,每到關(guān)鍵的、不可逆的環(huán)節(jié),比如真要付錢了,再停下來等你點(diǎn)頭確認(rèn)。
值得注意的是,谷歌這次開放這個(gè)能力也是相對(duì)小心翼翼的,它配了一個(gè)叫 Android Halo 的東西,在你屏幕頂部用很輕的方式顯示「智能體現(xiàn)在正在干什么、進(jìn)度到哪了」,讓你隨時(shí)能看見、隨時(shí)能叫停。其實(shí)谷歌也很清楚,「替你操作手機(jī)」是一件信任成本極高的事,它不敢全部大包大攬。

我認(rèn)為,過去十幾年,我們和手機(jī)的關(guān)系是「打開 App,再找功能」,而 Gemini Intelligence 想把它改成「提出需求,系統(tǒng)替你調(diào)用 App」。這個(gè)轉(zhuǎn)向如果成立,影響的就不只是一個(gè)助手好不好用,而是整套移動(dòng)端的交互邏輯。假如一句話就能干活,那 App 的圖標(biāo)還有存在的意義嗎?
這次 I/O 上,谷歌同時(shí)面向開發(fā)者推出了 AppFunctions,并且直接給了它一個(gè)副標(biāo)題:Android MCP。谷歌官方的描述是,AppFunctions 是一套 Android 平臺(tái) API,配套一個(gè) Jetpack 庫,讓你的應(yīng)用能像一臺(tái)「端側(cè) MCP server」一樣運(yùn)作,把自己的工具、服務(wù)和數(shù)據(jù)開放給系統(tǒng)和智能體調(diào)用。
MCP 這套協(xié)議,過去主要解決的是云端的事,就是讓 AI 智能體能標(biāo)準(zhǔn)化地連接到服務(wù)器側(cè)的各種工具。而 AppFunctions 做的,是把同樣的機(jī)制搬到了手機(jī)本地。
開發(fā)者只要把「創(chuàng)建備忘錄」「發(fā)送消息」「搜索郵件」「添加購物清單」這些能力,寫成一段段自帶自然語言描述的函數(shù),注冊(cè)到 Android 系統(tǒng)內(nèi)置的「能力清單」里,Gemini 這樣的智能體就能發(fā)現(xiàn)它們、調(diào)用它們。更關(guān)鍵的是,整個(gè)過程在設(shè)備本地執(zhí)行,延遲更低、也更利于隱私。

谷歌對(duì)未來手機(jī)系統(tǒng)的設(shè)想就是,未來的軟件會(huì)越來越像「一組能力」,而非單純「一組界面」。也就是,App 的圖標(biāo)可能會(huì)消失,轉(zhuǎn)而變成一些核心的能力留在用戶手機(jī)里,用戶也不需要記得這些 app 分別是干嘛的,只需要說自己的需求。
當(dāng)然,AppFunctions 目前的狀態(tài)還非常早期,對(duì)于那些還沒接入的 App,谷歌的兜底方案是另一套「UI 自動(dòng)化」框架,也就是讓 Gemini 退回到模擬點(diǎn)擊的老路子上去臨時(shí)頂一下。這就不得不提到豆包手機(jī)助手,它本質(zhì)上還是 GUI Agent 那套「看懂屏幕、模擬點(diǎn)擊」的邏輯,只是權(quán)限拉滿,才實(shí)現(xiàn)各種跨應(yīng)用的功能。
無論是哪種方案,趨勢(shì)已經(jīng)很清楚,App 不會(huì)消失,可 App 圖標(biāo)、首頁、傳統(tǒng)菜單這些「入口」的權(quán)重,可能會(huì)慢慢下降,用戶越來越不在意 App 本身,而是愈發(fā)看重 App 的核心能力。
過去十幾年,App 之間打的是一場(chǎng)「入口爭(zhēng)奪戰(zhàn)」,爭(zhēng)的是什么?是桌面第一屏的位置,所有的產(chǎn)品設(shè)計(jì)、所有的 push 通知、所有的紅點(diǎn),本質(zhì)上都是在搶用戶的關(guān)注度。
可一旦 AI 成了新的系統(tǒng)級(jí)入口,戰(zhàn)場(chǎng)就變了。未來 App 要搶的,是智能體的「調(diào)用次數(shù)」。當(dāng)用戶不再親手打開 App,而是把需求拋給 Gemini,那么「Gemini 決定去調(diào)哪個(gè) App」這件事,就成了新的兵家必爭(zhēng)之地。你想想,用戶說「幫我訂杯咖啡」,系統(tǒng)調(diào)的是瑞幸還是星巴克的 App 動(dòng)作?或者說,訂個(gè)酒店、買張機(jī)票,系統(tǒng)會(huì)推薦哪個(gè) App 呢?

早在 2024 年的 WWDC,它就高調(diào)演示過一個(gè)全新的 Siri,靠 App Intents 框架實(shí)現(xiàn)跨 App 操作,經(jīng)典的演示場(chǎng)景是:「找出上個(gè)月 Sarah 生日的照片,把最好的一張去掉背景,發(fā)到她的 Instagram?!挂痪湓?,Siri 在多個(gè) App 之間穿梭著把活干完。這套愿景,和今天 Gemini Intelligence 講的幾乎一模一樣。

但后面的故事大家也清楚了,這套個(gè)性化 Siri 原本計(jì)劃 2025 年上線,先是被推遲到 2026,又一路從 iOS 26.4 延到 26.5,這不馬上 iOS 27 都要來了,這能力也沒點(diǎn)頭緒。
蘋果高管 Craig Federighi 的解釋是,原本那套功能建在「V1」架構(gòu)上,能跑,但質(zhì)量不達(dá)標(biāo),必須重新建在新的「V2」架構(gòu)上。蘋果軟件工程負(fù)責(zé)人和營銷負(fù)責(zé)人在采訪里被追問具體日期,只含糊地說 2026 會(huì)上,那大概率就是 WWDC27 公開了。
其實(shí)呢,倒也不能完全怪蘋果???App 自動(dòng)化和生成一段文字完全是兩碼事,它要在意圖模糊、App 狀態(tài)在變、還涉及真實(shí)權(quán)限的情況下,精準(zhǔn)地執(zhí)行正確動(dòng)作,可靠性、準(zhǔn)確性,還有敏感內(nèi)容的問題,都是一道道坎。
所以,在「讓 AI 接管手機(jī)操作」這件事上,靠著 AppFunctions 這套開放給開發(fā)者的底層設(shè)計(jì),加上三星、谷歌兩家硬件先行鋪貨,更有可能率先跑出一個(gè)能用的「Agent OS」雛形。

那么回到最開始的問題,App 圖標(biāo)真的會(huì)因此消失嗎?雷科技(ID:leitech)的判斷是,圖標(biāo)不會(huì)消失,但它的權(quán)重會(huì)慢慢降低,直到用戶已經(jīng)不那么在意 " 自己該在什么時(shí)候去點(diǎn)擊哪個(gè)熟悉的圖標(biāo)執(zhí)行什么任務(wù) " 這件事。
它未必能在一兩年內(nèi)就改變所有人的習(xí)慣,畢竟手機(jī)這東西,承載了我們太多年的肌肉記憶。但至少在方向上,谷歌已經(jīng)替整個(gè)行業(yè)把「下一代手機(jī)長(zhǎng)什么樣」這道題的答案寫在了考卷上。