外傳上篇:逃獄者——Google 的無魂豪賭與 TPU 閉環
2022 年 9 月 29 日,Google 副總裁 Phil Harrison 在一篇官方部落格文章裡宣佈:Stadia 將於 2023 年 1 月 18 日永久關閉。
這是一個奇怪的死法。
Stadia 擁有全世界任何遊戲公司都夢寐以求的基礎設施:遍佈全球的資料中心、自家鋪設的海底光纖、YouTube 的十億級用戶入口、以及 Google 工程團隊幾十年累積的大規模分散式系統經驗。論技術底座,地球上沒有第二家公司比 Google 更適合做雲端遊戲。
但 Stadia 的月活躍用戶從未超過七十五萬。同一時期,Xbox Live 和 PlayStation Network 的月活躍用戶各自突破一億。
Harrison 在文章裡說的理由很溫和:「沒有獲得我們預期的用戶黏著度。」他沒有說的是:在他按下發佈鍵的同一秒,Google Play 商店正在全球二十億台 Android 手機上,以每筆交易自動抽取最高 30% 佣金的速度,從遊戲開發者口袋裡收錢。
2024 年,Google Play 的用戶消費總額超過 467 億美元。其中遊戲佔大約四成——將近兩百億美元。Google 從中抽走的佣金,遠超過 Stadia 三年營運期間的全部營收。
一邊是花了幾億美元建設、苦撐三年、月活不到一百萬的雲端遊戲平台。另一邊是零遊戲研發、零硬體成本、每一秒鐘自動進帳的平台稅。
Harrison 簽下關閉 Stadia 的文件時,大概連猶豫都沒有。
I. 降維打擊:為什麼不在泥沼裡打仗
正文第六章講了 Valve 怎樣用 Proton 撬開微軟的 DirectX 鎖。第七章講了 NVIDIA 怎樣用 CUDA 蓋了一座四層深的軟體監獄。兩場戰爭有一個共同點:戰場在 PC 和主機——你必須造硬體、寫驅動、建生態、搶開發者。每一步都是泥沼裡的肉搏。
Google 從頭到尾沒有踏進這片泥沼。
它做的事情更簡單 也更殘酷:它跳過了整個遊戲價值鏈的中下游,直接站在最上游收租。
2008 年,Android Market(Google Play 的前身)上線。Google 沒有自己開發任何一款遊戲。它做的事只有一件:提供一個所有 Android 手機預裝的商店,然後對每一筆數位內容交易抽取 30% 佣金。後來降到首年百萬美元以內抽 15%,超過的部分仍然是 30%。
這個模式的本質,跟第六章裡 Steam 的 30% 平台稅一模一樣。但 Google 的版本更極端。
Valve 至少還在做兩件事:第一,它自己開發遊戲(《Half-Life》《Portal》《Dota 2》),理解遊戲是什麼;第二,它建造了 Proton、DXVK、Steam Deck——花真金白銀去解決「讓更多遊戲跑起來」的技術問題。Valve 收的那 30%,至少有一部分被拿去養工程師、寫翻譯層、推 Linux 生態。
Google 收的那 30%,沒有任何一分錢回到遊戲本身。
它不設計遊戲引擎。不投資工作室。不推動圖形 API 標準。不跟 GPU 廠商合作優化驅動。它甚至不做遊戲品質審核——Google Play 上充斥著換皮遊戲和廣告農場。Google 對遊戲的全部態度,可以濃縮成一個詞:報表。
每一款遊戲在 Google 眼中,都是一行報表上的數字。下載量、日活、付費轉換率、ARPU——這些指標決定它在商店裡的排名。遊戲好不好玩?那是開發者的事。Google 只負責收租。
這就是正文第六章提出的 pattern 的一個極端變體:便利吸引開發者(全球最大的行動裝置安裝基數)→ 鎖定效應箍住開發者(你的用戶在 Android 上,你的收入透過 Google Play 結算,你不可能離開)→ 反過來向開發者收取壟斷溢價(30% 佣金,沒有議價空間)。
而代價呢?
代價是 Google 對遊戲這件事本身,沒有任何理解。這個代價在 Stadia 身上兌現了。
II. Stadia 之死:擁有一切,卻少了一個東西
2019 年 3 月,Google 在舊金山的 GDC(遊戲開發者大會)上發佈 Stadia。發佈會的規格令人窒息:4K 解析度、HDR 色彩、5.1 環繞音效、延遲低於 30 毫秒。背後是 Google 遍佈全球的邊緣運算節點。Phil Harrison 站在台上,用一句話總結了 Google 的野心:「未來最強大的遊戲平台,不需要任何硬體。」
技術上他說的是對的。
但他漏算了一件事:技術從來不是遊戲平台成敗的決定因素。
第三章講過,Xbox 第一代的硬體規格遠勝 PS2。但 PS2 靠著龐大的遊戲庫和先發優勢,在那一個世代賣出超過一億五千萬台。第四章講過,世嘉 Dreamcast 是當時技術最先進的主機——它死了。硬體和技術解決的是「能不能做到」的問題。但遊戲平台的勝負取決於另一個問題:開發者願不願意為你做遊戲。
開發者願不願意,取決於信任。
任天堂的開發者信任任天堂會把遊戲當遊戲看。Sony 的第一方工作室——至少在 Jim Ryan 拆牆之前——信任 PlayStation 會給他們時間做好一款作品。連 Valve 的開發者都知道,Gabe Newell 自己就是一個玩家,他理解遊戲的價值不只是報表上的數字。
Google 給開發者的信號是什麼?
2021 年 2 月,Stadia 上線不到兩年,Google 關閉了自己的第一方遊戲工作室 Stadia Games and Entertainment。一間還沒來得及發佈任何遊戲的工作室,就這樣被砍了。
對全世界的遊戲開發者來說,這個動作傳遞的信號只有一個:Google 隨時會走。
而 Google 確實走了。因為 Google 做每一個產品的方式都是一樣的:設定一個用戶目標、給兩到三年的跑道、達標就加碼、不達標就殺。這個流程對搜尋引擎、對廣告平台、對雲端服務都有效。對遊戲無效。
因為遊戲生態的建立需要十年。
Xbox 從 2001 年推出第一代,到 2013 年 Xbox One 才真正在訂閱模式上找到自己的定位——十二年。PlayStation 從 1994 年的 PS1 到 2020 年 PS5 的生態成熟——二十六年。Steam 從 2003 年上線到 2022 年 Steam Deck 證明 PC 遊戲不需要 Windows——十九年。
沒有一個成功的遊戲平台是在三年內建起來的。
Google 不是沒有資源。它是全世界最有錢的公司之一。但它的體制——季度考核、OKR 驅動、專案隨時可殺——跟遊戲生態所需要的長期承諾,在結構上不相容。
正文裡我們給這種特質取了一個名字:報表靈魂。 Google 有全世界最精密的報表。但報表看不見「一個開發者花三年做了一款沒人買但改變了類型定義的遊戲」這種事情的價值。報表只看得見下載量和收入曲線。
Stadia 的死因不是技術。是靈魂。
Google 有全球最好的基礎設施、最快的網路、最強的工程團隊——但它沒有 Game Soul。它有的是 Spreadsheet Soul。而 Spreadsheet Soul 可以讓你在 Google Play 上每秒鐘自動收租,卻沒辦法說服任何一個開發者:「把你的心血之作,獨佔放在我的平台上。」
III. TPU:唯一一個成功的逃獄者
但 Google 在另一場戰爭裡,做到了一件沒有任何其他公司做到的事。
它逃出了 CUDA 的監獄。
第七章用了相當篇幅講 NVIDIA 的四層鎖:硬體指令集、運算函式庫、AI 框架、知識體系。全世界的 AI 研究員——從博士生到大型實驗室——全部被鎖在這四層裡面。AMD 用 ROCm 追了十年,追不上。每一家 AI 新創公司在成立第一天,就已經是 NVIDIA 的俘虜。
Google 不是。
原因很簡單,也很殘酷:Google 自己重建了全部四層。
2013 年,Google 內部開始設計一種專門為機器學習優化的晶片。2015 年,第一代 TPU 在 Google 的資料中心裡投入運作——那時候外界甚至不知道它的存在。2016 年 5 月,Google 才在一篇論文裡正式公佈 TPU 的存在。
到了 2026 年,TPU 已經演化到第七代(代號 Ironwood)。Gemini 2.0——Google 最強大的 AI 模型——是用第六代 TPU(Trillium)訓練出來的。
用第七章的框架來看 Google 做了什麼:
第一層——硬體指令集: NVIDIA GPU 有自己的原生指令集(PTX/SASS),TPU 也有自己的。但 TPU 的指令集從一開始就為矩陣運算而設計——它不需要兼顧遊戲繪圖,不需要背負 CUDA 向後相容的歷史包袱。每一個電晶體都花在 AI 需要的地方。
第二層——運算函式庫: NVIDIA 有 cuDNN、cuBLAS、NCCL。Google 有 XLA(Accelerated Linear Algebra)編譯器——一個可以把高階運算自動編譯成 TPU 原生指令的系統。XLA 不是一個函式庫,它是一個編譯器。這意味著 Google 的工程師不需要手動針對每一種運算寫優化版——編譯器替他們做。
第三層——AI 框架: NVIDIA 靠 PyTorch 和 TensorFlow 在這一層鎖住開發者。但 TensorFlow 是誰寫的?Google。JAX 是誰寫的?Google。Google 不是被別人的框架 鎖住的——它自己就是框架的作者。 它可以隨時修改框架的底層,讓 TPU 成為最佳運行目標。
第四層——知識體系: Google 內部有幾千名 AI 研究員。他們不需要去 Stack Overflow 上找 CUDA 的教學——他們用的是 Google 內部的工具鏈、內部的文件、內部的基礎設施。他們的知識體系是圍繞 TPU 而非 CUDA 建立的。
四層鎖,Google 全部繞過。不是用「翻譯」的方式繞(那是 Valve 對付 DirectX 的方法),而是用「重建」的方式。它造了自己的硬體、自己的編譯器、自己的框架、自己的研究團隊——一座完全獨立於 NVIDIA 生態的城池。
但這座城池有一個關鍵特徵:它是封閉的。
TPU 不賣給終端用戶。你不能像買一張 GeForce 那樣去百思買買一張 TPU 卡。你只能透過 Google Cloud 租用 TPU 算力——按小時計費。2025 年,Google 開始嘗試向企業直接銷售 TPU 硬體,但規模極小,而且買家基本上是跟 Google 有深度合作關係的機構。
這意味著 Google 的「逃獄」,是一種只有 Google 做得到的逃獄。
為什麼?因為 Google 有一樣東西是全世界任何其他公司都沒有的:龐大到足以撐起一整條自建晶片供應鏈的內部需求。
YouTube 的推薦系統。Google 搜尋的排名演算法。Gmail 的垃圾郵件過濾。Google Photos 的影像辨識。Google 翻譯。Google Maps 的即時路況預測。Gemini。——這些服務加起來,每秒鐘消耗的 AI 運算量,比大多數國家的全部 AI 算力還大。
Google 不需要說服外面的開發者來用 TPU。它自己就是 TPU 最大的客戶。它不需要建立「生態」——它自己就是生態。
這就是「內部閉環」的本質。 Google 同時是晶片的設計者、框架的作者、模型的訓練者、和服務的運營者。它不需要跟任何人合作,不需要說服任何人遷移,不需要等待任何第三方函式庫的支援。它一個人,把 NVIDIA 用十年時間、靠全球千萬遊戲玩家建立的生態,在自己的圍牆花園裡從零複製了一套。
IV. 逃獄的代價
但逃獄者付出了什麼代價?
第一個代價:Google 的 TPU 逃獄對其他人毫無意義。
一個在大學裡用 PyTorch 寫 AI 模型的博士生,不會因為 Google 有 TPU 就能逃出 CUDA 的監獄。他的論文要用 PyTorch 寫、用 CUDA 跑、在 NVIDIA GPU 上訓練。他可以申請 Google 的 TPU 研究計劃免費使用一些算力,但他的程式碼最終還是要能在 NVIDIA GPU 上跑——因為他的論文審稿人會用 NVIDIA 的機器驗證他的實驗。
Google 的逃獄是一個人的逃獄。它不是越獄革命。
第六章裡 Valve 的 Proton 是一場真正的越獄——它把翻譯層開源,讓所有 Linux 用戶都受益。它撬開的門,是全世界的門。Google 的 TPU 撬開的門,只通向 Google 自己的後花園。
第二個代價:Stadia 的死亡證明,技術閉環無法替代生態。
Google 有全球最好的雲端基礎設施、有 TPU 的運算能力、有 YouTube 的用戶入口。但這些東西加在一起,做不出一個活的遊戲平台。因為遊戲平台的核心不是技術——是信任、是內容、是開發者願意用三年甚至五年的時間為你做一款好遊戲的承諾。
這跟第七章的 CUDA 故事形成了一個有趣的鏡像。
NVIDIA 的 CUDA 生態不是 NVIDIA 自己建的——是全球的大學教授、博士生、開源貢獻者、AI 新創公司,在十年裡自然長出來的。NVIDIA 提供了土壤(免費的 CUDA 工具鏈、開發者文件、大學贊助計劃),但植物是自己長的。這就是為什麼 CUDA 的鎖這麼深——因為你不是在跟 NVIDIA 一家公司競爭,你是在跟一整個自然生長的生態競爭。
Google 的 TPU 生態是 Google 自己建的。每一行程式碼、每一個工具、每一份文件,都是 Google 的工程師寫的。這讓 Google 可以完全控制——但也意味著它永遠不會有 CUDA 那種「千萬人自發貢獻」的爆發力。
Google 證明了一件事:CUDA 的四層鎖是可以繞過的。但繞過的方式——從零重建全部四層——需要的資源和內部需求規模,全世界只有不超過三家公司做得到。
Google 是一家。另外兩家可能是 Amazon(自研 Trainium 晶片)和 Meta(自研 MTIA 晶片)。但即使是這兩家,也遠遠沒有達到 Google 的閉環程度。
對於第七章結尾那個試圖把 GPU 叢集從 NVIDIA 換成 AMD 的年輕工程師來說,Google 的 TPU 跟他沒有關係。他依然困在 CUDA 的監獄裡。唯一的區別是,他現在知道有人逃出去了——而逃出去的那個人,是一個擁有全世界最大廣告收入的科技巨頭,一個永遠不需要向任何外部開發者低頭的公司。
這個事實讓監獄的牆看起來更高了,不是更矮。
V. 結算:報表靈魂的勝利與代價
回到 Harrison 簽下 Stadia 關閉文件的那一刻。
從 Google 的報表來看,這是一個完全理性的決定。Stadia 的月活不到一百萬,運營成本高昂,遊戲庫貧乏,開發者信心崩盤。砍掉它,把工程資源轉移到 AI 和 YouTube——這是報表會給 你的建議。
但報表不會告訴你另一件事。
Google 在行動遊戲市場上每年收取將近兩百億美元的佣金——這些錢來自遊戲開發者的心血。但 Google 沒有把這筆錢的任何一部分投回遊戲本身。沒有用它來資助引擎開發、培養工作室、推動圖形技術進步。這些錢被 Google 收走,然後消失在 Google 的總營收裡,變成 AI 研發預算、雲端基礎設施擴張、和搜尋引擎的廣告優化。
Google 是遊戲產業最大的寄生者。 它從遊戲身上抽取利潤,但對遊戲生態的貢獻是零。
正文裡的 pattern 是這樣的:便利吸引用家 → 鎖定開發者 → 壟斷收租。每一次變奏裡,鎖的建造者至少做了一件事——推動了某種技術進步。微軟用 DirectX 統一了 PC 遊戲的繪圖介面。NVIDIA 用 CUDA 催生了 AI 運算。台積電用先進製程讓晶片越做越強。連 Valve 都用 Proton 證明了遊戲不需要 Windows。
Google 什麼都沒做。它只是站在 Android 平台的高處,向下面的遊戲開發者伸手收錢。
這是 pattern 的一個病理變體:鎖定存在,壟斷溢價存在,但完全沒有推動任何技術進步。 純粹的價值抽取。
而 Google 在 TPU 上的成功,則揭示了一個更冷的事實:打破壟斷鎖定的唯一方式,是擁有足以無視外部生態的內部規模。 如果你不是 Google,如果你沒有全球最大的 AI 內部需求,你就逃不出去。
第七章的結論是:CUDA 的四層鎖,到今天為止沒有人撬得開。
這篇外傳的補充是:有一個人「逃」出去了——但他不是撬開了鎖,他是在監獄旁邊蓋了自己的城堡。鎖還在那裡。其他人還困在裡面。
而那個蓋了城堡的人,連一款遊戲都做不好。
這也許是科技世界最諷刺的定律:你可以用工程力量繞過任何技術鎖定。 但你繞不過「沒有靈魂」這件事。Google 有全世界最好的基礎設施、最強的 AI、最多的錢。但它做不出一個讓人願意在上面花三年做遊戲的平台。因為平台不是技術問題。平台是信任問題。而信任,是報表上唯一一個永遠顯示不出來的數字。