豆包受限與硅谷聯(lián)盟:誰在影響中國萬億AIoT市場的未來?
12月1日,豆包手機(jī)正式上線,字節(jié)跳動終于亮出了其AI硬件的底牌。然而,牌局剛開局,就被打亂了。

上線次日,用戶嘗試讓豆包智能體操作微信時(shí),騰訊后臺立即發(fā)出警報(bào):賬號被判定為“登錄環(huán)境異?!?,強(qiáng)制下線,部分賬號還遭到了短期凍結(jié)。阿里系也同步采取行動:在淘寶、閑魚、大麥等APP中,豆包的自動化操作頻繁觸發(fā)人機(jī)驗(yàn)證,甚至導(dǎo)致閃退和強(qiáng)制登出。銀行方面更為嚴(yán)格,農(nóng)行、建行直接以“風(fēng)險(xiǎn)環(huán)境”為由,徹底禁止了智能體的登錄和支付通道。這是中國互聯(lián)網(wǎng)的一次集體“免疫排異”反應(yīng)。
12月5日,豆包團(tuán)隊(duì)發(fā)布公告,宣布限制智能體在刷分、刷激勵、金融支付及部分游戲場景中的操作權(quán)限。簡單來說,就是主動退縮。從上線到妥協(xié),僅用了不到五天時(shí)間。
四天后,大洋彼岸傳來了一個(gè)截然不同的消息。
當(dāng)?shù)貢r(shí)間12月9日,Anthropic宣布將MCP(模型上下文協(xié)議)正式捐贈給Linux基金會旗下的AI智能體基金會。這意味著MCP不再是一家公司的私有資產(chǎn),而成為了一個(gè)中立的開放標(biāo)準(zhǔn)。Anthropic做出了一個(gè)選擇:放棄獨(dú)占,以換取行業(yè)共識。
一邊是圍追堵截,一邊是開放共建。將這兩件事放在一起看,恰好揭示了當(dāng)前AI發(fā)展最核心的矛盾。
豆包所代表的GUI智能體路線,實(shí)際上是一種未經(jīng)授權(quán)的“數(shù)字寄生”。它繞過APP構(gòu)建的壁壘,通過模擬人類點(diǎn)擊來獲取服務(wù)。短期來看,這條路似乎繞過了接口障礙;但從本質(zhì)上講,這是對平臺數(shù)據(jù)主權(quán)的粗暴侵犯。在微信、淘寶等平臺看來,這并非技術(shù)創(chuàng)新,而是流量劫持,是一場不宣而戰(zhàn)的偷襲。
AI智能體想要的是數(shù)據(jù)的“最惠國待遇”,而平臺看到的卻是“破門而入”。
雙方立場無法調(diào)和,沖突在所難免。
更嚴(yán)重的是,這種依賴“視覺識別+模擬點(diǎn)擊”的路線本身就是一條死路。沒有底層協(xié)議的支撐,AI智能體只能扮演“黑客”的角色,與APP的反爬蟲、反外掛機(jī)制進(jìn)行游擊戰(zhàn)。手機(jī)算力充足且更新頻繁,或許還能通過OTA勉強(qiáng)維持兼容;但對于更廣泛的AIoT設(shè)備,如智能眼鏡、智能音箱、智能家電來說,這簡直是一場災(zāi)難。
想象一下:你的智能冰箱依賴模擬點(diǎn)擊來調(diào)用外賣APP,某天美團(tuán)更新了一版用戶界面UI,按鈕位置移動了幾個(gè)像素,冰箱就徹底“失明”了。這并非假設(shè),而是GUI智能體路線的必然結(jié)局。如果AIoT生態(tài)建立在“破解”與“模擬”之上,那么它將脆弱得不堪一擊。顯然,這條路走不通。
硅谷聯(lián)盟:用協(xié)議終結(jié)混亂
國內(nèi)廠商還在為“模擬點(diǎn)擊”的合規(guī)性頭疼不已時(shí),硅谷已經(jīng)換了一種打法。
12月9日,Linux基金會宣布成立AI智能體基金會(AAIF)。成員名單值得仔細(xì)研究:AWS、谷歌、Meta這些老面孔并不意外,真正有意思的是OpenAI和Anthropic。這兩家公司在大模型領(lǐng)域競爭激烈,如今卻坐到了同一張桌子前。
這并非行業(yè)聯(lián)盟的例行公事,而是一次利益格局的重新劃分。
促成這次“握手”的并非理想主義情懷,而是一個(gè)冷酷的成本核算:在智能體時(shí)代,單一模型的智力優(yōu)勢正在達(dá)到頂峰,真正的瓶頸是互操作性。如果每個(gè)AI都要為成千上萬個(gè)SaaS應(yīng)用單獨(dú)開發(fā)適配接口,或者像豆包那樣暴力破解前端界面,整個(gè)行業(yè)的邊際成本將高得無法承受。
巨頭們算清楚了:互操作性釋放的生態(tài)價(jià)值,遠(yuǎn)大于封閉系統(tǒng)帶來的壟斷紅利。與其各自加固護(hù)城河,不如合力把蛋糕做大。
這個(gè)共識的第一個(gè)產(chǎn)物,就是Anthropic捐出的MCP(模型上下文協(xié)議)。
MCP解決的是一個(gè)極其基礎(chǔ)的問題:大模型如何連接外部數(shù)據(jù)?過去,讓模型接入本地文件、數(shù)據(jù)庫或Slack,需要為每個(gè)數(shù)據(jù)源單獨(dú)編寫適配代碼,開發(fā)繁瑣、維護(hù)成本高且穩(wěn)定性差。MCP的作用就是強(qiáng)行統(tǒng)一這套連接標(biāo)準(zhǔn)。一個(gè)接口,就能適配所有數(shù)據(jù)源。模型端和數(shù)據(jù)端從此實(shí)現(xiàn)解耦。

實(shí)際上,AI智能體基金會的“開山項(xiàng)目”不只是MCP,還有OpenAI捐贈的AGNTS.md以及Google捐贈的構(gòu)建智能體和工作流的框架。
如果把MCP比作充電接口的USB-C標(biāo)準(zhǔn),那么AGENTS.md就是寫給AI看的用戶手冊。AGENTS.md明確告訴AI,這個(gè)網(wǎng)站或應(yīng)用有哪些數(shù)據(jù)可讀、哪些API可調(diào)、參數(shù)該如何傳遞。再配合Google開源的A2A(Agent-to-Agent)協(xié)議,即一套專為AI工程設(shè)計(jì)的通用執(zhí)行框架,開發(fā)者就擁有了從連接、認(rèn)知到執(zhí)行的完整工具鏈。
這套組合拳的意圖很明確:將智能體的交互模式從“打游擊”升級為“正規(guī)軍”。
豆包的GUI智能體依靠視覺識別和模擬點(diǎn)擊,本質(zhì)上是在應(yīng)用的表面做文章,脆弱、低效且隨時(shí)可能觸犯法律紅線。而基于MCP等協(xié)議的交互,則是通過API管道直達(dá)核心數(shù)據(jù),路徑清晰、權(quán)責(zé)分明。
硅谷正在制定的不只是一套技術(shù)規(guī)范,更是AI世界的基礎(chǔ)通信協(xié)議。正如TCP/IP定義了互聯(lián)網(wǎng)的數(shù)據(jù)傳輸規(guī)則,MCP試圖定義AI理解和操作外部世界的通用語言。
70%普及率背后的死結(jié)
根據(jù)“人工智能+”行動意見,我國國家層面的時(shí)間表已經(jīng)確定:2027年,新一代智能終端、智能體普及率超過70%,2030年突破90%。這不是愿景,而是硬指標(biāo)。
但問題是:這70%如何實(shí)現(xiàn)?
如果小米的空調(diào)聽不懂百度的指令,華為的手機(jī)無法調(diào)用阿里的服務(wù),所謂的“普及”就只是一堆無法互聯(lián)的孤島。這不是普及,而是內(nèi)耗。
目前的現(xiàn)實(shí)是:硬件廠商忙著建造圍墻,想把用戶鎖進(jìn)自家的設(shè)備全家桶;互聯(lián)網(wǎng)巨頭忙著挖掘護(hù)城河,死守?cái)?shù)據(jù)不外流。每一方都在加固自己的堡壘,結(jié)果導(dǎo)致整個(gè)生態(tài)被分割成碎片。
碎片化是AIoT規(guī)?;涞氐淖畲笳系K。
更麻煩的是,這種內(nèi)部割裂正遭遇外部擠壓。美國已經(jīng)通過AAIF確立了統(tǒng)一戰(zhàn)線,如果中國遲遲拿不出對等的標(biāo)準(zhǔn)體系,將同時(shí)面臨兩個(gè)陷阱。
第一個(gè)陷阱:直接照搬MCP。
看起來省事,但在數(shù)據(jù)主權(quán)日益敏感、中美技術(shù)脫鉤持續(xù)加深的背景下,將底層交互協(xié)議的定義權(quán)拱手讓出,后患無窮。協(xié)議標(biāo)準(zhǔn)從來不是中立的技術(shù)文件,它決定了數(shù)據(jù)如何流動、誰能讀取、誰被排斥。
第二個(gè)陷阱:各自為戰(zhàn)。
如果拒絕通用協(xié)議,阿里搞一套,騰訊搞一套,華為再搞一套,開發(fā)者就只能疲于奔命,為每個(gè)平臺重復(fù)開發(fā)基礎(chǔ)功能。研發(fā)成本降不下來,產(chǎn)品迭代速度慢,最終拖慢整個(gè)行業(yè)的落地節(jié)奏。
一邊是“被定義”的風(fēng)險(xiǎn),一邊是“自己亂”的風(fēng)險(xiǎn)。留給中國AIoT產(chǎn)業(yè)的選擇空間正在縮小。
破局的窗口正在關(guān)閉
標(biāo)準(zhǔn)真空不會永遠(yuǎn)存在。要么中國自己定義規(guī)則,要么被別人的規(guī)則定義。
方向其實(shí)很明確:中國需要建立自己的智能體互聯(lián)協(xié)議(姑且稱之為CN-MCP)。但這件事最大的障礙不是技術(shù),而是誰來牽頭。百度主導(dǎo),騰訊不會跟隨;華為制定,小米未必認(rèn)可。任何一家巨頭主導(dǎo)的標(biāo)準(zhǔn),都會被視為“私貨”,難以獲得全行業(yè)的信任。
唯一可行的路徑,是由國家級產(chǎn)業(yè)聯(lián)盟或中立的開源基金會出面,以公信力打破門戶壁壘。
但即便解決了牽頭問題,中國的CN-MCP也不能照搬美國模式。原因很簡單:生態(tài)結(jié)構(gòu)不同。
美國的互聯(lián)網(wǎng)是以Web和SaaS為主導(dǎo)的開放生態(tài),AI智能體可以通過API直接抓取網(wǎng)頁數(shù)據(jù),路徑清晰。中國則不同,中國的服務(wù)高度集中在微信、抖音、美團(tuán)這些超級APP里,被封裝在小程序和原生應(yīng)用的黑盒中,外部根本無法觸及。
所以,CN-MCP要解決的不只是“連接”問題,更是“服務(wù)原子化”問題。也就是說,不能讓AI繼續(xù)依靠模擬點(diǎn)擊來操作APP,那條路已經(jīng)被證明走不通。真正要做的,是推動超級APP將內(nèi)部功能拆解成可被外部調(diào)用的標(biāo)準(zhǔn)化接口。美團(tuán)的訂餐、攜程的服務(wù)、微信的聊天、12306的購票……都應(yīng)該變成AIoT設(shè)備可以直接調(diào)用的原子服務(wù)。
這需要各方都做出改變。
政府層面,應(yīng)當(dāng)將智能體互聯(lián)標(biāo)準(zhǔn)提升到新基建的高度。這不是可選項(xiàng),而是數(shù)字經(jīng)濟(jì)的底層管道。沒有統(tǒng)一的交互協(xié)議,AIoT產(chǎn)業(yè)的規(guī)?;涞鼐褪强照?。
互聯(lián)網(wǎng)巨頭也需要想清楚一件事:在移動互聯(lián)網(wǎng)時(shí)代,封閉或許還能鎖住流量;但在AI時(shí)代,封閉就是自我邊緣化。如果你的服務(wù)無法被智能體讀取和調(diào)用,在未來的物聯(lián)網(wǎng)世界里,你就是隱形的。開放接口,讓APP成為AIoT的底層基礎(chǔ)設(shè)施,才是延續(xù)生命力的唯一選擇。
在AI時(shí)代,封閉不是護(hù)城河,而是自掘墳?zāi)埂?/p>
寫在最后
豆包手機(jī)的遭遇,不是產(chǎn)品的失敗,而是路徑的失敗。
它撞上的那堵墻:巨頭封鎖、接口缺失、生態(tài)割裂,不是偶然事件,而是現(xiàn)行秩序的必然反應(yīng)。在沒有通用協(xié)議的世界里,任何試圖跨越圍墻的嘗試,都會被當(dāng)作入侵者處理。
但這堵墻本身,也在逐漸松動。
依靠攝像頭“看”屏幕、模擬點(diǎn)擊的GUI智能體,本質(zhì)上是一種過渡方案——在舊接口體系尚未瓦解、新協(xié)議標(biāo)準(zhǔn)尚未建立的空窗期,它是唯一能運(yùn)行的路徑。但它不是最終的解決方案。真正的終局,是通用協(xié)議取代私有接口,是服務(wù)像水電一樣通過標(biāo)準(zhǔn)管道流向終端。
那時(shí)的AIoT設(shè)備會是什么樣?不再需要預(yù)裝幾十個(gè)APP來搶占算力和內(nèi)存,只需要內(nèi)置一套通用協(xié)議。硬件回歸感知和交互功能,服務(wù)按需調(diào)用,即時(shí)抵達(dá)。
問題在于:這套協(xié)議由誰來定義?
互聯(lián)網(wǎng)時(shí)代的核心是把人連接起來,智能體時(shí)代的核心是把萬物和服務(wù)連接起來。誰掌握了連接的標(biāo)準(zhǔn),誰就掌握了下一個(gè)十年的底層規(guī)則。這場標(biāo)準(zhǔn)之爭,我們不應(yīng)旁觀。
本文來自微信公眾號 “物聯(lián)網(wǎng)智庫”(ID:iot101),作者:彭昭,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com




