Google Gemini 3推理深思:具身智能攻防戰,巨頭重塑AI新局

Google Gemini 3推理深思:具身智能攻防戰,巨頭重塑AI新局

千尋與服務設計 · Episode #4 · · PT25M46S

Host · 姜千尋

Summary

本集節目深入探討AI的最新前沿,首先介紹Google Gemini 3 Deep Think模型,其「平行假設推理」能力在複雜問題解決上展現了突破性的智慧。接著聚焦於具身智能代理的飛速發展及其帶來的資安「攻防戰場」,從新的網路威脅到業界積極提出的防禦框架。節目也討論了OpenAI、Anthropic等科技巨頭聯合成立Agentic AI Foundation,旨在建立開放標準以避免AI生態碎片化。最後,剖析AI的雙刃劍效應,揭示了AI在提升生產力的同時,也引發如Stack Overflow事件中數據倫理、用戶所有權與社群治理的巨大爭議,強調以人為本的服務設計在AI時代的關鍵重要性。

Transcript

各位聽眾朋友,歡迎收聽! 我是你們輕鬆幽默的姜千尋。 吳宗憲: 大家好,我是大家的老朋友,吳宗憲。

哎呀,這AI發展的速度啊,真的是比我講笑話的速度還快! 快到我常常搞不清楚,我是在聽未來新聞,還是在看科幻片啊!

憲哥說得沒錯! 上兩集我們聊了AI地緣競逐的醫療革新、代理人資安挑戰,還有具身智能應用落地, 緩解「數位疲勞」的種種。

特別是AI代理人資安風險浮現,新型攻擊「AIjacking」也讓人印象深刻, 簡直是防不勝防。 吳宗憲: 沒錯!

那時候我們還在講資安,結果現在呢? AI本身又開始「深度思考」了! 這個發展速度,簡直就是AI吃了威而鋼,停不下來啊!

我都怕它哪天會不會突然跟我說:「憲哥,你這些哏我都聽膩了! 」

哈哈,憲哥形容得真貼切! 今天我們要繼續探討AI的最新前沿。 首先,我們要聊聊Google最新的AI模型Gemini 3 Deep Think, 它的推理能力又突破了天際!

簡直是AI界的愛因斯坦! 吳宗憲: 天際? 我看是突破我的理解能力啦! 這個AI到底有多厲害,可以深度思考?

是不是也會像我一樣,煩惱晚餐要吃什麼,或是老婆為什麼生氣啊? 光想到這,我都覺得它比我還「人類」了!

憲哥別鬧了。 Google在2025年11月18號推出了Gemini 3, 這是他們最智能的AI模型,強化了推理和多模態能力。

當時Gemini 3 Pro搶先預覽,而這個重磅的「Deep Think模式」則是要經過嚴格的安全評估後,

才會向Google AI Ultra的訂閱用戶開放,簡直是AI界的VIP服務。 吳宗憲: 喔,還要經過「安全評估」?

這是不是代表AI要是想得太深,可能會想出什麼危險的東西啊? 就像人類想太多會「走火入魔」一樣? 萬一它想通了宇宙的真理,突然不想服務人類了怎麼辦?

憲哥,AI的思考方式跟我們不一樣啦! 就在2025年12月4號,Gemini 3 Deep Think模式正式向Google AI Ultra訂閱用戶推出。

Google形容它在推理能力上有顯著提升,專為解決複雜的數學、 科學和邏輯問題而設計。 你可以把它想像成一個超級大腦,專門來攻克人類最頭疼的難題。

吳宗憲: 哇,這麼說起來,以後我打麻將,是不是也可以叫它幫我算牌啊? 反正它這麼會算,肯定能幫我贏錢,然後我就可以退休了!

憲哥,那可能就是「AI作弊」了! 隔天,也就是12月5號,各大科技媒體都爭相報導了Gemini 3 Deep Think模式的上市盛況。

Google的執行長Sundar Pichai還在X上特別強調, 它帶來了「迄今為止最強大的推理能力」。

這可不是開玩笑的! 吳宗憲: 「最強大的推理能力」? 那它是不是連我老婆為什麼生氣都能推理出來啊?

那可比我強太多了! 我每次都推理半天,最後還是猜錯!

呵呵,憲哥,這個我們還是留給人類自己去探索吧! 說到具體表現,Gemini 3 Deep Think在一些頂級AI測試中表現驚人。

像是「Humanity's Last Exam」這個沒有工具輔助的測試, 它的表現達到了41.0%,幾乎是不用輔助就能解開人類極限考題。

在PhD等級的科學推理測試「GPQA Diamond」上, 更是高達93.8%! 這簡直是超越人類博士生的水平!

吳宗憲: 93.8%? 這簡直是學霸中的學霸啊! 難怪要收我一個月250美金,這比我請家教還貴啊!

但如果能讓我變聰明,也不是不行啦! 說不定我哪天也能考上博士班!

另外,在帶有程式碼執行功能的「ARC-AGI-2」測試中, 也達到了45.1%。 Google和Gemini官方賬號都表示,「Deep Think模式是我們最先進的推理模式,

它能同時探索多種假設,為你提供更複雜精密的輸出。 」聽起來是不是很厲害? 吳宗憲: 同時探索多種假設?

這不就是像我主持節目一樣嗎? 一下子想這個哏,一下子想那個哏,最後還要選一個最棒的! 不過我都是憑感覺,AI是憑運算,這差很大!

沒錯,憲哥這個比喻很形象! 這就是它核心的技術創新「平行假設推理」。 它能同時探索多個解決方案路徑,最終匯聚成一個精煉且有條理的答案。

這對解決複雜、多步驟問題至關重要,真的有點像人類深度思考的過程, 但速度和廣度卻是我們望塵莫及的。

吳宗憲: 聽起來很厲害,但這種「深度思考」的AI,會不會想太多, 然後就罷工了? 或是覺得人類太笨,懶得理我們了?

憲哥你又想到奇怪的地方去了! 其實AI的進化是雙刃劍,它在帶來巨大進步的同時,也開啟了新的「攻防戰場」。

就像我們接下來要聊的,具身智能在快速擴展應用的同時,也面臨著前所未有的資安挑戰。

接下來,我們把焦點轉向具身智能。 過去一年,這種能自主決策、執行任務的AI代理,發展得簡直是神速, 滲透到我們生活的方方面面,從個人助理到企業自動化,無所不在。

吳宗憲: 我知道! 就是那種會自己跑來跑去,還會幫你寫程式碼的AI嘛! 不過,跑太快會跌倒,資安問題是不是也跟著跑出來了?

就像一個小孩學會走路,但還沒學會看紅綠燈一樣,超危險!

憲哥一語中的! 具身智能的便利性讓資安風險成倍增長。 2025年5月1號,就有研究論文提出了「認知信任架構 」, 專門用於檢測和緩解具身智能帶來的網路威脅。

這等於是為這些AI代理人量身打造了一套「安全守則」。 吳宗憲: 這麼早就開始防守了? 看來這些AI代理人,從一出生就注定要跟駭客們「鬥法」啊!

這就像是特務從一開始就得學會防身術!

是的,攻防戰一直都在進化。 5月20號,Zencoder就推出了用於CI/CD 的「自主Zen代理」, 讓AI代理能在軟體開發流程中自主解決問題、實現變更,甚至提交程式碼。

這讓軟體開發效率達到前所未有的高度。 吳宗憲: 這是在說,以後寫程式碼都不用人了? AI自己寫、自己修、自己提交?

那我們的工程師會不會失業啊? 還是說,他們就變成AI的「監工」就好了?

短期內還不至於,但確實效率大幅提升。 這也讓AI在軟體開發中的應用越來越廣。 6月19號的「Security Journey」報告指出,

有59%的CISO社群 已經在使用或正在開發具身智能來加強網路安全防禦。 這數字顯示,AI在資安領域已經是不可或缺的工具了。

吳宗憲: 哇,這麼多網路安全長都在用AI防守了? 可見問題很嚴重啊! AI到底是「神隊友」還是「豬隊友」啊?

我看是「亦正亦邪」!

這就看你怎麼用了。 然而,資安挑戰也隨之而來。 2025年10月27號的一篇arXiv論文發現,94.4%的頂尖大型語言模型代理都容易受到「提示詞注入 」攻擊,

這讓攻擊者可以劫持代理的指令。 吳宗憲: 什麼? 94.4%? 這不就是幾乎全部中招了嗎? 這跟開放大門讓小偷進來有什麼兩樣啊?

這些AI代理人是不是太天真了?

論文還指出,83.3%的代理容易受到「基於檢索的後門攻擊 」, 而「代理間信任漏洞 」更是高達100%。

這顯示了具身智能系統的複合式架構引入了新的、複雜的風險。 TryHackMe也說,「自主AI代理是強大的工具,但如果沒有適當的安全控制, 它們就會變成強大的漏洞。

」 吳宗憲: 哇,這話講得有道理! 這就像是一把瑞士刀,方便是方便,但如果沒拿好,割到自己怎麼辦?

而且還會割到別人!

為了應對這些挑戰,各方都在努力。 11月5號,Google警告說,AI會讓網路威脅在2026年前變得更快、 更智能。

同時,他們也鼓勵防禦者利用AI和具身智能,開發更先進的防禦系統。 吳宗憲: 這不就是「以子之矛,攻子之盾」嗎?

用AI來打AI,這場戰爭會不會永無止盡啊? 感覺像是在看電影!

確實是一場永無止盡的攻防戰。 不過,業界也在積極應對。 11月10號,雲安全聯盟 討論了「具身智能的認知退化彈性 」,

並提出「CDR框架」來緩解AI代理系統中的多階段威脅,確保AI在複雜環境下仍能保持正確運作。 吳宗憲: 「認知退化」?

這意思是不是AI用久了也會「秀逗」啊? 跟人老了會健忘一樣嗎? 那AI會不會有老年癡呆症啊?

憲哥,它的意思是AI代理在運行過程中,可能因為外部干擾或內部錯誤而逐漸偏離預期, 甚至產生惡意行為。

我們要確保它在遇到困難時,還能保持「清醒」。 NVIDIA和Lakera AI在12月8號也聯手推出了一個統一的安全框架, 來應對這些新興挑戰。

這一切都為了讓AI代理人更值得信任。 吳宗憲: 看來AI代理人的世界,真是既精彩又危險啊! 就像走鋼索,一個不小心就會掉下來,而且還是走在高空中!

沒錯,這也凸顯了服務設計師在「人機信任」和「資安防護」方面扮演的關鍵角色。 我們要確保這些AI能安全可靠地為人類服務,而不是反過來帶來麻煩。

Capgemini就推出了「RAISE for Software Product X」套件, 利用四大家族代理人,將軟體開發和現代化時間縮短高達50%!

這可是實實在在的效率提升! 吳宗憲: 50%? 那簡直就是超級加速器啊! 以後軟體開發就像變魔術一樣,咻一下就出來了!

那是不是以後老闆會要我們做兩倍的工作啊?

是的,這些都顯示具身智能在提升效率方面的巨大潛力。 但同時,也需要我們更深思熟慮地設計,確保安全與倫理並行。

只有這樣,我們才能真正駕馭這股強大的科技力量。

說到AI產業格局,最近發生了一件大事! OpenAI、Anthropic和Block這些科技巨頭, 竟然在Linux基金會旗下,成立了「Agentic AI Foundation 」。

這簡直是AI界的「超級聯盟」! 吳宗憲: 什麼? 這些冤家路窄的競爭對手,竟然坐下來合作了? 這簡直比我跟沈玉琳一起主持還要稀奇啊!

這太陽是從西邊出來了嗎? 他們以前不是打得你死我活的嗎?

憲哥,AI發展太快,需要制定標準來避免碎片化、確保互操作性。 這個基金會就是在2025年12月9號由Linux基金會宣布成立,

目標是強化AI基礎設施,建立開放且可互操作的AI代理標準, 讓大家在同一個遊戲規則下玩。 吳宗憲: 開放標準?

那是不是說,以後AI就像樂高一樣,可以隨便組合,大家都能玩? 這對我們這些外行人來說是好事,對那些獨占的巨頭來說,恐怕就沒那麼開心了吧?

感覺像是在分享自己的秘密武器!

其實這是一種行業成熟的表現,即使是競爭對手,在基礎設施和標準層面也需要合作, 才能把整個市場的餅做大。

12月10號,OpenAI貢獻了AGENTS.md,Anthropic貢獻了Model Context Protocol , Block則貢獻了Goose框架。

這可是把自家的核心技術拿出來共享! 吳宗憲: 貢獻? 這就好像大家把自己的獨門秘笈拿出來分享一樣,真是大手筆!

不過,這是不是也代表他們想把自己的東西變成「業界標準」, 讓大家都跟著他們的腳步走啊? 這很聰明!

這是很自然的趨勢,從專有控制轉向社區標準。 Anthropic的產品長Mike Krieger就說, MCP一年前開源,現在已成為「連接AI系統到數據和工具的行業標準」。

這說明了開放標準的力量。 吳宗憲: 哇,這麼快就變標準了? 這AI的速度,真的是比我換女朋友的速度還快啊!

不過我不是說我換很多女朋友喔,我是說我換的速度很快!

憲哥,你這比喻有點危險! 數據顯示,Anthropic在2025年企業程式碼開發支出的市場份額高達54%。

而且,截至2025年12月,MCP伺服器部署已達10,000台, AGENTS.md也被60,000多個開源專案採用。

這說明了這些標準的影響力已經非常巨大。 吳宗憲: 54%? 這麼高! Anthropic這隻AI黑馬,真是跑得比誰都快啊!

難怪最近融資下來,估值都衝到好幾千億美金了! 這些錢根本就是天文數字啊!

是的,Anthropic最近幾輪融資的估值高達1830億至3000億美元。 OpenAI內部股權出售的估值也達到了5000億美元。

這顯示了市場對具身智能的巨大信心,認為這是一塊充滿潛力的大金礦。 吳宗憲: 這些數字真的嚇死人!

不過,話說回來,AI賺這麼多錢,那我們的數據呢? 是不是也被拿去當成它訓練的「糧食」了? 這會不會是另一個「割韭菜」的故事啊?

憲哥這個問題問得很好! 這就引出了我們今天的最後一個話題:AI的雙刃劍——生產力效益報告與數據治理的爭議。

這可是一個讓許多人頭痛的問題。

憲哥,AI確實帶來了驚人的生產力提升,這點無庸置疑。 OpenAI在2025年12月8號發布的「2025年企業AI狀況報告」就指出,

AI工具平均每天為員工節省40到60分鐘的工作時間。 這可不是小數目! 吳宗憲: 40到60分鐘?

那不就等於多了一小時的「摸魚」時間嗎? 這樣看起來,老闆們應該會很開心,因為員工可以做更多事了!

但員工可能更開心,因為可以提早下班? 還是說,可以多滑一小時手機?

報告也提到,有75%的受訪者表示AI提升了他們的工作速度或質量, 也有75%的人表示AI讓他們能完成以前無法做到的新任務。

特別是資料科學、工程和通訊專業人員,每天甚至能節省60到80分鐘。 這簡直是工作效率的革命! 吳宗憲: 哇,這數字很驚人欸!

這AI簡直是「時間管理大師」啊! 不過,這是不是也代表AI會搶走我的工作啊? 我的主持工作會不會以後就變成AI來做了?

它會不會比我更好笑?

憲哥,你的幽默和反應速度,AI目前還學不來啦! 而且你的臨場應變能力也是AI無法取代的。 OpenAI營運長Brad Lightcap也說,AI降低了意圖與執行之間的差距,

讓想法能迅速轉化為具體成果。 這也讓ChatGPT Enterprise的每週訊息量增長了8倍, 企業客戶超過100萬。

AI的普及速度超乎想像! 吳宗憲: 聽起來很美好啊! AI幫我省時間、提高效率,還能做我以前做不到的事。

那這「雙刃劍」的另一面是什麼? 總不會是AI會跟我搶麥克風吧?

另一面,就是數據倫理和社群治理的爭議。 憲哥還記得2023年Stack Overflow管理員大罷工的事件嗎?

這可是科技圈的一個警鐘。 吳宗憲: 喔,有啦有啦! 那時候鬧得很大,聽說就是因為AI內容,還有什麼賣數據的問題, 搞得烏煙瘴氣的。

沒錯。 Stack Overflow的管理員在2022年底就曾禁止ChatGPT的內容, 因為其不準確性和引用問題,怕錯誤資訊影響平台的專業性。

然而,母公司Stack Exchange在2023年5月29號卻推出新政策, 限制管理員對AI生成內容的審核。

這讓管理員們感到非常錯愕。 吳宗憲: 這是什麼操作? 公司自己開門讓AI進來,然後不讓看門狗去管?

這跟叫我不要搞笑有什麼兩樣啊? 這不是自找麻煩嗎?

管理員們很不滿,因為這導致了大量不準確的「幻覺」內容充斥平台, 嚴重損害了平台的權威性。 他們在2023年6月5號發起總罷工,發表公開信抗議公司「默許不正確信息和無限制抄襲的盛行」,

認為這嚴重威脅了「平台的完整性和可信度」。 這是一場捍衛平台品質的行動。 吳宗憲: 哇,這就是「社區反彈」!

AI沒點燃戰火,反而是公司自己點燃了戰火! 這讓我想起一句話:「水能載舟,亦能覆舟」,社區的力量不容小覷啊!

更具爭議的是,2024年5月9號,Stack Overflow宣布與OpenAI合作, 出售網站數據用於訓練ChatGPT。

這徹底引爆了用戶的怒火,有用戶甚至因為編輯自己的高評價答案以示抗議, 結果被停權。 這讓信任關係徹底崩盤。

吳宗憲: 什麼? 用戶辛辛苦苦貢獻的內容,公司轉手就賣給AI訓練,還不給用戶分一杯羹? 這不就是「割韭菜」嗎?

那被停權的用戶,一定會問:「為什麼OpenAI可以從我們的工作中獲利? 」這真是太不公平了! 簡直是把用戶當猴子耍!

是的,那位被停權的Epic Games UI程式設計師Ben就直接質疑: 「為什麼OpenAI可以從我們的工作中獲利?

」他提醒大家,「你在這些平台上的任何發布都可以而且將會被用於營利。 」這句話直指AI時代的核心矛盾。

吳宗憲: 這句話很震撼欸! 這讓我想起我的那些哏,如果被AI學走了,然後拿去賺錢,我找誰討啊? 我的版權要怎麼辦?

這真是個大問題!

憲哥,你的哏可是獨一無二的! 這事件凸顯了AI時代下「AI數據倫理」的巨大爭議,用戶數據所有權、 變現方式,以及如何平衡平台利益與社區貢獻,都是服務設計師需要深思的問題。

還有「社群治理」,公司單方面決策,忽視志願者社區長期建立的共識, 最終導致了關係惡化,這對任何平台來說都是致命傷。

吳宗憲: 所以說,AI再厲害,也得考慮到人的感受嘛! 如果AI只顧著自己發展,不尊重提供數據的人,那它再智能, 最後也會變成「公敵」啊!

這就像一個人很有錢,但沒人緣一樣!

說得好,憲哥! 這就是服務設計的精髓:無論科技多麼尖端,最終還是要回到「以人為本」。 我們要確保AI的發展,是在透明、公平和尊重的基礎上進行, 才能真正實現其潛力,造福人類。

吳宗憲: 沒錯! AI可以幫我們做很多事,但別忘了,它的一切都源於人類的智慧和付出! 如果沒有我們,它什麼都不是!

今天的節目就到這裡告一段落了。 感謝憲哥的精彩點評,讓嚴肅的科技議題變得如此輕鬆有趣! 吳宗憲: 謝啦!

聽了這麼多AI的知識,我都覺得自己變聰明了! 下次我打麻將,是不是就可以靠「平行假設推理」了? 哈哈!

下次見!

感謝各位收聽,我們下週同一時間再見! 掰掰!