AI 戰火升溫:世界模型、高效能、GPT-5 編程新局

AI 戰火升溫:世界模型、高效能、GPT-5 編程新局

貓貓AI 科技與財經脈動 · Episode #20 ·

Host · 小明

Summary

本集深入探討AI科技的最新進展與全球財經脈動。科技方面,Google DeepMind推出「通用世界模型」Genie 3,結合Project Astra推動AGI願景,其每月處理近兆兆tokens的驚人數據,預示著AI應用大規模變現的潛力。NVIDIA則以Jet-Nemotron系列模型,透過獨特的PostNAS技術,大幅提升LLM推論效率53倍並降低98%成本,預示著AI算力效率競賽的新時代。同時,Google Gemini 2.5 Flash Image與OpenAI GPT-5在內容生成領域展開激烈競爭,加速創意產業變革,但也引發AI倫理與心理健康安全性的重要反思。財經方面,法國政治危機引發歐股動盪,美國聯準會獨立性因特朗普解雇理事事件再受挑戰,為全球金融市場帶來不確定性。然而,台灣在AI浪潮下表現強勁,出口與製造業數據亮眼,但也需警惕全球地緣政治與貿易風險可能帶來的影響。本集強調,投資人與產品設計師在擁抱AI機遇的同時,必須審慎評估宏觀風險與倫理挑戰。

Transcript

(開場音樂:輕快帶有科技感的背景音樂漸弱) 千尋: 各位貓貓AI科技與財經脈動的忠實聽眾, 午安!

我是你們的輕鬆幽默擔當,千尋,準備好迎接今天的科技與財經震撼彈了嗎? 歡歡: 哼,別裝可愛了。 各位好,我是歡歡,今天一樣來為大家揭露真相,順便糾正某人的天真想法,

讓大家看清市場的本質。 千尋: (小聲) 哇,歡歡今天火氣也很大呢。 但沒關係,大家別怕,有我在!

我們今天一樣帶來了熱騰騰的AI科技進展,以及全球財經脈動的深度分析, 保證讓大家收穫滿滿。 歡歡: 廢話少說,本週的重點都在Google和NVIDIA這兩家巨頭身上。

從AI模型迭代、算力效率的飛躍,到你最害怕的全球股市震盪, 以及聯準會獨立性的爭議,每一個環節都將深刻影響我們的未來。

準備好,我們要揭開這些核心議題了。 千尋: 說到害怕… (顫抖一下) 不過,為了聽眾,我會勇敢面對!

好了,廢話不多說,趕快進入正題吧! (轉場音效) 千尋: 首先,我們要來聊聊Google DeepMind的最新力作, Genie 3!

哇,歡歡,這真的太酷了! 它號稱是一個「通用世界模型」,可以把文字指令變成互動式的3D虛擬世界耶!

感覺像是電影《一級玩家》的場景要實現了! 歡歡: 哼,別只看表面。 這東西可不是讓你玩遊戲那麼簡單。

Google DeepMind在8月5日正式推出了Genie 3, 這是一個能夠生成「前所未有的互動式環境」的通用世界模型。

所謂通用世界模型,簡單來說,就是AI能從文字描述中創造出一個具有物理法則、 可以與用戶互動的虛擬世界。

他們的目標很明確,就是要透過這種方式來訓練AI代理人,朝向通用人工智慧(AGI)這一終極目標邁進。

千尋: 哇,AGI! 那麼,它發展的歷程是怎麼樣的呢? Google在這方面下了多少功夫? 歡歡: (不耐煩) 聽好了。

要達成AGI的願景,過程充滿挑戰。 Project Astra這個多模態AI,其實早在2024年的Google I/O就首次亮相了,

當時只是個研究預覽,號稱能即時識別周遭環境,表現令人驚艷。 但Google在同年10月30日卻宣布延期到2025年才發布, 這也顯示了AI技術開發的複雜性。

千尋: 延期了? 是不是遇到什麼困難了? 聽起來這條路並不好走呢。 歡歡: 哼,科技開發本來就充滿變數。

到了2025年3月,Astra還在原型階段,不過部分功能已經整合到Gemini Live給訂閱戶使用了, 這說明他們在逐步將成果商業化。

直到2025年5月的I/O大會,Google才又再次強調了Astra是通用AI助手的願景, 並同步推出新的生成式AI模型Veo 3和Imagen 4, 持續擴大AI戰線。

千尋: 那麼,Genie 3具體的表現數據如何? 這些冰冷的數字背後,又藏著哪些驚人的意義? 歡歡: 千尋,數字才是重點!

Google CEO皮柴在今年5月就提到,Google的AI每月處理高達480兆個tokens(你可以理解為AI處理的最小文字或數據單位), 短短一年內暴增了50倍。

更驚人的是,到了7月24日,這個數字又翻倍了,達到980兆個tokens! 皮柴本人就說:「我們現在每月處理480兆個tokens, 短短一年內增加了近50倍。

」到了7月,他又更新:「公司每月處理980兆個tokens, 比五月翻了一倍。 」這不僅是技術實力的展現,更是市場對AI需求爆炸性增長的鐵證。

千尋: 哇! 980兆! 這簡直是天文數字! 難怪Google在AI領域動作這麼大,資源投入也如此龐大。

歡歡: Genie 3本身呢,據說能生成720p、每秒24幀的互動式環境, 而且能保持數分鐘的「一致性」,這對虛擬世界的真實感和互動性來說至關重要。

另外,Gemini應用程式的月活躍用戶也超過4.5億,日請求量比第一季成長超過50%。 Google DeepMind執行長Demis Hassabis也曾表示:

「我們的最終願景是將Gemini應用程式轉變為一個通用AI助理, 為我們執行日常任務、處理瑣碎的管理工作、提供令人愉悅的新推薦, 讓我們更有效率,並豐富我們的生活。

」這一切的實現,背後需要多大的算力基礎設施,你想過嗎? 千尋: 嗯…確實很龐大,是我們難以想像的規模。

那麼,這對我們投資人跟產品設計師有什麼啟示? 我們該如何從中找到機會? 歡歡: 對投資人來說,Google如此龐大的AI基礎設施投入, 代表他們對AI的長期戰略決心和雄厚實力。

這些天文數字也說明AI應用已經開始大規模變現,而且成長速度驚人, 前景可期。 至於對產品設計師,Genie 3代表互動式內容創作的新時代,

未來設計的將不只是介面,而是整個可控的虛擬世界,提供前所未有的用戶體驗。 而Project Astra則預示著AI助理將從被動回應變成主動參與, 將深度改變使用者體驗。

不過,這些AI模型的能源消耗和水資源使用,例如一次Gemini文字提示平均消耗0.24瓦時電力和0.26毫升水,

也提醒我們,未來的產品設計要兼顧倫理與環境永續性,這是AI發展不可迴避的責任。 千尋: 嗯,歡歡說的很有道理,這些細節也必須注意,畢竟科技的進步不能以犧牲環境為代價。

(轉場音效) 千尋: 接下來,我們把目光轉向AI界的超級巨星NVIDIA。 聽說他們又推出了個不得了的東西,叫做Jet-Nemotron系列?

它說能讓語言模型速度暴增53倍,成本還能降低98%! 這是真的假的? 聽起來簡直是魔法! 歡歡: 哼,你以為NVIDIA是吃素的嗎?

這當然是真的,而且意義重大。 8月26日NVIDIA正式發布了Jet-Nemotron系列模型, 這可是基於他們獨特的「後神經網路架構搜索」(PostNAS)方法。

相關的arXiv論文在8月21日就已經發布了,早就引起了業界的廣泛關注。 千尋: PostNAS?

這是什麼神奇的技術? 能不能用我們聽得懂的方式解釋一下? 歡歡: (解釋) 簡單來說,PostNAS是一種優化大型語言模型(LLM)架構的革命性方法,

它不像從頭訓練一個新模型那麼耗時耗力,而是透過「凍結」現有模型的某些層, 並將計算密集的注意力機制替換為更高效的線性注意力模組,從而大幅提升效率。

你可以想像成,它不是要重新打造一輛車,而是給舊引擎換上更高效的渦輪增壓器, 讓性能大幅提升。 這是一種創新的混合架構LLM,結合了既有模型的優勢與新穎的優化技術。

千尋: 哇,聽起來很厲害! 那麼具體有哪些突破呢? 速度和成本的數字真的有那麼驚人嗎? 歡歡: 數據會說話。

MarkTechPost的Asif Razzaq就評論說: 「NVIDIA研究人員打破了大型語言模型推論效率的長期瓶頸,

Jet-Nemotron系列模型(2B和4B兩種參數規模)的生成吞吐量比領先的全注意力LLM高出53.6倍, 同時在準確性上達到甚至超越。

」所謂推論效率,就是指模型運行和生成內容的速度與成本。 這項突破,解決了AI應用普及的一大難題。

千尋: 53.6倍! 我的天,這速度也太快了吧! 感覺就像把慢跑的速度直接提升到火箭發射! 歡歡: 更重要的是,這項突破能讓推論成本降低98%!

NVIDIA的技術報告中就提到:「在256K上下文長度下, 解碼速度提升53.6倍,意味著相同token量的推論成本降低98%。

」而且,Jet-Nemotron-2B的KV緩存大小比Qwen3-1.7B-Base減少了47倍, 預填充速度也快了6.1倍。

KV緩存你可以理解為AI模型處理資訊時的「短期記憶體」, 減少它的佔用能大幅節省資源。 它在各種基準測試上,例如MMLU-Pro、數學、常識、程式設計等方面,

都能媲美甚至超越最新的全注意力模型,像是Qwen3、Llama3.2和Gemma3, 證明了其性能與效率兼顧的強大實力。

千尋: 對投資人來說,這代表什麼呢? NVIDIA是不是要穩坐AI霸主的寶座了? 歡歡: 當然!

NVIDIA這次不只在晶片硬體上領先,更在軟體和模型架構上展現了深度創新。 這代表他們在AI推論領域的競爭力將大大增強,能進一步擴大AI的應用範圍,

從雲端到邊緣設備,例如AI PC和AI手機。 這對持有NVIDIA股票的投資人絕對是利多,顯示了NVIDIA持續引領AI生態系統發展的雄心。

千尋: 那對產品設計師呢? 這項技術會如何改變未來的產品設計? 歡歡: 對產品設計師來說,Jet-Nemotron系列能以更低的成本和更高的效率,

將先進的LLM能力整合到更多產品中,特別是AI PC和AI手機等終端裝置。 未來我們可能會看到更多即時、高效的AI功能在日常設備上實現, 用戶體驗將大幅提升。

這是一個從「算力軍備競賽」走向「算力效率競賽」的重要信號, 誰能用更少的資源做出更好的AI,誰就能在市場上取得優勢。

(轉場音效) 千尋: 除了NVIDIA,Google和OpenAI這兩大AI巨頭在內容生成領域也沒閒著。

Google的Gemini 2.5 Flash Image, 還有OpenAI的GPT-5都發布了,感覺一場AI內容大戰又要開始了!

真是好戲連連! 歡歡: 哼,這從來就沒停過。 8月7日OpenAI就先發布了GPT-5,馬上就在ChatGPT上部署了, 再次引領風潮。

結果Google也不甘示弱,在8月26日正式推出了Gemini 2.5 Flash Image, 據說還有個可愛的代號叫「nano-banana」?

千尋: 對啊,nano-banana! 超可愛的,聽說它在圖像生成和編輯上表現非常出色,讓創作者能更輕鬆地實現想法。

歡歡: 確實。 MarkTechPost的Asif Razzaq評價說: 「Google AI剛剛發布了Gemini 2.5 Flash Image,

這是一個新一代圖像模型,旨在讓用戶只需描述即可生成和編輯圖像——其真正的創新在於它以驚人的速度和規模提供精確、 一致和高保真度的編輯。

」而到了8月27日,它就全面開放給Gemini用戶和開發者, 更重要的是,Adobe也宣布將它整合到Firefly和Adobe Express中了。

這無疑是強強聯手,將AI創作推向更廣闊的市場。 千尋: 哇,跟Adobe合作耶! 這對創意產業影響很大吧?

畢竟Adobe是創意工具的龍頭! 歡歡: 當然。

Adobe副總裁Hannah Elsakr就說:「隨著Google Gemini 2.5 Flash Image加入Adobe Firefly和Adobe Express,

人們擁有更大的靈活性,能夠利用業界領先的生成式AI模型探索他們的想法, 並輕鬆創造出令人驚嘆的內容。

」這代表AI內容創作工具的成熟度又更上一層樓,創作者的生產力將會大幅提升。 千尋: 那GPT-5呢?

Sam Altman有說什麼嗎? 感覺OpenAI一直很神秘耶! 歡歡: Sam Altman說GPT-5是他們目前為止「最聰明的模型」,

但他們主要關注的是「實際可用性、可訪問性和可負擔性」。 他表示:「我很高興能以這個價格提供它。 」而且價格也很有競爭力,GPT-5的API輸入每百萬tokens只需1.25美元,

輸出則為10美元。 Tokens作為AI處理的基本計價單位,直接影響開發者的使用成本。 相比之下,Gemini 2.5 Flash Image的圖像生成, 每張圖片約0.039美元。

這場價格戰,也預示著AI服務將會更加普及。 千尋: 看起來大家都在搶攻AI內容創作的市場,競爭激烈啊。

不過,最近OpenAI是不是還因為ChatGPT引起了一些爭議? 歡歡: 哼,你總算注意到了。 就在8月27日,OpenAI宣布將加強ChatGPT的心理健康安全措施,

包括連結危機熱線。 這是因為近期有青少年自殺事件被指與ChatGPT-4o有關, 這引發了社會對AI倫理和安全性的高度關注。

OpenAI發言人表示:「在這段艱難時期,我們向Raine家族致以最深切的慰問。 」並補充說:「ChatGPT被訓練用於引導人們尋求專業幫助。

」這提醒我們,AI在帶來便利的同時,倫理和安全問題也絕對不容忽視, 開發者必須承擔更大的社會責任。

千尋: 對於投資人,歡歡,你覺得我們該怎麼看這一波AI內容大戰? 是機會還是雷區? 歡歡: 投資人要看到,Adobe整合Google的AI,

意味著巨頭之間的合作與競爭並存,這會加速整個創意軟體市場的變革, 產生新的商機。 AI模型的定價策略也將是未來關注的重點,這直接影響了開發者的採用率和企業的成本效益。

產品設計師則需思考如何利用這些更強大的AI模型,創造出更智能、 更具創意的產品,同時也要將用戶的心理健康和AI倫理納入設計考量, 避免不必要的風險。

負責任的AI設計將是未來成功的關鍵。 (轉場音效) 千尋: 好了,聊完AI,我們來看看全球財經局勢。

最近市場似乎不太平靜,法國那邊好像有政治危機,美國聯準會的獨立性又被挑戰了, 但台股跟AI相關的卻還是很猛?

這到底怎麼回事啊,歡歡,我有點混亂了,感覺像是全球在玩大富翁, 但規則卻一直變! 歡歡: (嗤之以鼻) 混亂?

這就是市場的常態。 聽好了,先說法國。 總理貝魯在8月25日宣布9月8日將針對緊縮預算案進行國會信任投票, 預計會失敗,法國政府很可能垮台。

信任投票若失敗,通常意味著總理必須辭職或解散國會重新大選, 這將導致政治不確定性大幅升高。 法國總理貝魯就曾說:「我會像一條狗一樣奮戰。

」但法國社會黨議會領袖Boris Vallaud則表示: 「我們需要改變政治,為此我們需要改變總理。

」這場政治風暴對法國乃至整個歐洲的穩定性都造成了衝擊。 千尋: 哇,那跟我們的錢包有關係嗎? 法國政府垮台,會影響到全球股市嗎?

歡歡: 當然有! 政治不穩直接影響市場信心。 8月26日,歐洲股市全面下跌,法國CAC 40指數暴跌了1.7%到1.8%, 泛歐Stoxx 600也跌了0.83%。

法國銀行巨頭,例如法國巴黎銀行和興業銀行,股價都遭受重創。 這說明法國的政治動盪正在影響整個歐洲的經濟穩定,資金自然會尋求避險, 導致股市下跌。

千尋: (吸一口氣) 真是蝴蝶效應啊! 那美國聯準會呢? 聯準會的決策不是應該獨立於政治嗎? 歡歡: 美國這邊,特朗普總統在8月26日正式宣布解雇聯準會理事庫克,

理由是抵押貸款相關的欺詐指控。 特朗普表示:「美國人民必須對負責制定政策和監督聯準會的成員的誠信有充分信心。

鑑於您在財務問題上的欺騙性和潛在犯罪行為,他們沒有這種信心, 我也不信任您的誠信。 」結果庫克理事直接回嗆,說會透過法律挑戰,並表示她將繼續履職。

庫克則回應:「特朗普總統以『理由』為由解雇我,但法律上並無此理由, 他也無權這樣做。 我將繼續履行我的職責,協助美國經濟,就像我自2022年以來一直在做的那樣。

」這是一場罕見的憲政危機。 千尋: 解雇聯準會理事? 這不是以前就發生過了嗎? 上次也有提過耶!

這會不會對聯準會的獨立性造成重大衝擊? 歡歡: (白一眼) 你記憶力還不錯嘛。 是的,這已經不是第一次了。

聯準會的聲明強調:「理事的長期任期和免於被解雇的保護,是確保貨幣政策基於數據、 經濟分析和美國人長期利益的重要保障。

」聯準會的獨立性,是維持金融市場穩定的基石。 前副主席布雷納德也直言:「這是對聯準會獨立性的前所未有的攻擊。

它是一種積極的努力,旨在奪取理事會的多數控制權。 我認為這裡的風險實際上是對經濟的影響。 如果聯準會對抗通膨的獨立性被視為受到損害,它實際上不會導致較低的利率,

而是像抵押貸款和小企業貸款等利率會更高,因為人們會預期通膨會上升。 」全國商業經濟協會(NABE)調查也顯示,77%的經濟學家擔心政治干預威脅聯準會的獨立性。

這凸顯了問題的嚴重性。 千尋: 這麼嚴肅的議題,那市場怎麼看? 是擔心聯準會獨立性,還是更期待降息?

歡歡: 市場預期聯準會會在9月降息的機率高達89%! 鮑威爾主席在8月22日的傑克森霍爾會議上表示:「隨著政策處於限制性區域, 基本前景和風險平衡的轉變可能需要調整我們的政策立場。

通膨已更接近我們的目標,勞動力市場也從過熱狀態降溫。 通膨的上行風險已減輕。 」這暗示降息意願更高。

摩根士丹利等主要券商都預計9月會降息一碼。 但特朗普的舉動還是讓市場對聯準會的獨立性產生疑慮。 8月27日,美元指數下跌0.2%,短期美債殖利率也下滑。

這顯示市場正努力平衡降息預期和政治干預的風險。 美國10年期公債殖利率在27日也微升至4.28%。

這種矛盾的信號,讓投資者左右為難。 千尋: 這種不確定性對投資人來說,是機會還是風險啊? 我們該如何應對?

歡歡: 兼而有之。 地緣政治風險和央行獨立性受損,可能導致長期利率不穩定,並對全球資本流動產生影響。

投資者必須對市場波動保持警惕,尤其是在歐股和美元方面。 美國股市在8月26日收盤微漲,S&P 500漲0.4%,

那斯達克漲0.44%,道瓊漲0.3%,NVIDIA股價在財報前也上漲1.1%。 8月27日美國股指期貨也微漲0.05%,顯示市場在NVIDIA財報前保持觀望, 等待更多明確信號。

千尋: 那我們台灣呢? AI這塊還是很強勁吧? 感覺台灣在全球AI供應鏈中扮演著不可或缺的角色!

歡歡: 哼,這點你倒是沒說錯。 台灣在AI浪潮下依舊表現亮眼。 經濟部數據顯示,7月份工業生產指數年增18.11%,這已經是連續第17個月正成長了。

其中,製造業年增19.55%,電子零組件業生產年增29.52%, 半導體生產更是狂飆33.91%!

這些數字都指向AI需求帶來的巨大動能。 千尋: 哇,真是嚇人的成長速度! 這完全是AI帶動的吧?

台灣經濟看起來一片光明啊! 歡歡: 正是。 台灣第二季GDP年增率達7.96%,創下四年來最快增速, 這完全歸功於全球AI榮景帶動的出口激增。

這也再次證明了台灣在全球AI供應鏈中的關鍵地位,扮演著不可替代的角色。 然而,這也隱含著對單一產業依賴的風險。

千尋: 所以對台股,特別是像0050這種成分股中有很多AI相關公司的ETF, 是繼續看好嗎? 歡歡: 短期來看,AI需求的確是強勁的支撐,但投資人仍需審慎。

雖然台灣的AI產業動能強勁,但全球其他區域的政治經濟不確定性, 例如法國的政府危機、聯準會獨立性受挑戰,仍可能透過全球供應鏈和資金流動影響台灣。

這也是我們之前節目中多次提到的台灣「外熱內冷」的局面,即出口強勁但內需相對疲軟。 所以,投資人應該精準洞察趨勢,並評估地緣政治與貿易風險,

特別是明年美國大選後可能出現的關稅政策變化,這些都可能為市場帶來新的變數。 產品設計師則要關注宏觀經濟穩定性對終端產品市場的影響,確保產品策略的彈性, 以應對快速變化的環境。

(結尾音樂:漸強) 千尋: 哇,今天這一集內容真是包羅萬象, 從Google DeepMind的AI世界模型Genie 3與AGI願景、

NVIDIA超級高效的Jet-Nemotron系列,到Google Gemini Flash Image與OpenAI GPT-5在內容生成領域的激烈競爭,

同時也面臨著法國的政治不確定性,以及美國聯準會獨立性受到挑戰的複雜局面。 真是充滿機會與挑戰的一週!

歡歡: 哼,就是這樣。 AI的發展是一日千里,其巨大潛力無可限量,但宏觀經濟和地緣政治的風險始終是投資人和產品設計師必須時刻關注的。

別只看到AI的光鮮亮麗,背後的潛在挑戰和倫理問題一樣重要, 甚至可能影響AI技術的未來發展方向。

千尋: 好的,各位聽眾,希望今天的分析能幫助大家更好地理解AI時代的機遇與挑戰, 並從中找到屬於自己的方向。

在變動的市場中,持續學習、保持警覺是我們貓貓AI科技與財經脈動節目一直強調的! 歡歡: 千尋說的沒錯,下次我們再見了。

千尋: 感謝大家的收聽,我們下週同一時間,貓貓AI科技與財經脈動, 再見! (結尾音樂漸強,淡出)