主題七：AI 影視的路線之爭——2D 生成 vs 3D 世界模擬

核心論點

Sora 的退場不代表 AI 影視已死——而是宣告了：靠暴力算力「憑空生成」影片的商業模式，在沒有低成本算力和分發平台的前提下走不通。 AI 影視的未來取決於技術路線選擇、成本結構、和分發管道三者的組合。

一、兩條路線的技術分野

路線 A：2D 生成式（Sora / Veo / Seedance）

原理： 擴散模型（Diffusion Model）或變形器架構（Transformer），直接從文字描述「畫」出影片的每一個像素。本質上是一個極其複雜的「預測下一幀圖像」的過程。

優勢：

使用門檻極低——任何人只要會打字就能生成影片
視覺震撼度高，能產出風格化的驚艷畫面
迭代速度快，模型能力每年大幅提升

致命弱點：

角色不一致： 同一角色在不同鏡頭間的外貌、服裝、身材可能完全不同
時空不連續： 缺乏物理法則的理解，鏡頭之間的空間和時間關係混亂
算力黑洞： 每次生成都是從零開始的海量運算，無法重複利用
創作不可控： 像抽獎——不滿意就重新生成，無法精確編輯特定元素

路線 B：3D 世界模擬（聚力維度等）

原理： 先建構一個 3D 虛擬世界（場景、角色、光影、物理規則），再讓 AI 在這個世界裡「拍攝」。本質上是傳統 CG 電影製作流程的 AI 加速版。

優勢：

角色高度一致： 使用固定的 3D 模型，角色外貌不會變化
物理法則正確： 3D 引擎天然模擬重力、光影、碰撞
資產可重複使用： 場景和角色建模完成後可反覆使用，邊際成本下降
創作可控： 可精確調整鏡頭運動、燈光、演員表演

弱點：

技術門檻高，目前成熟度遠不及 2D 生成式
3D 資產建模本身仍需大量人工或 AI 輔助
內容品質（特別是角色表情和動態）仍待突破

對比表

	2D 生成式	3D 世界模擬
適合內容	短影音、概念展示、社群素材	連續劇、動畫、工業級影視
算力需求	極高，每次生成都燒	相對可控，資產可復用
角色一致性	弱	強
產品成熟度	高（多家已商用）	低（多在研發或早期商用）
商業驗證	部分驗證（快手 Kling ARR 2.4 億美元）	幾乎未驗證

二、2D 路線的最新戰局（截至 2026 年 3 月）

Google Veo 3.1

2026 年 1 月發布，已通過 Gemini API、Vertex AI 和 Gemini 應用向開發者與消費者開放
支援原生音訊同步（對白、環境音、音效一併生成）、4K upscaling、原生直式影片
已整合進 YouTube Shorts 和 Google Ads（Asset Studio），讓創作者和廣告主直接用 AI 生成影片
支援文字轉影片、圖片轉影片，電影級幀率與物理模擬
結構性優勢： 自研 TPU 壓成本 + YouTube / Google Ads 做分發 → 同樣走 2D 路線，在 Google 手上走得起來

字節跳動 Seedance 2.0

2026 年 3 月開始在 CapCut（剪映國際版）上分批上線
首批市場：巴西、印尼、墨西哥、菲律賓、泰國、越南
支援原生音視頻同步、角色一致性、多鏡頭生成
結構性優勢： 字節有 TikTok/抖音的超級分發平台 → 即使算力是租的，也能靠分發撐住

快手 Kling

2025 年底 ARR 超過 2.4 億美元，用戶突破 6000 萬
推出 Omni 系列模型（Video O1、2.6 等），強調多模態能力
已深度整合進行銷、電商、影視的專業工作流
結構性優勢： 快手平台 + 激進的商業化策略

Sora 的死亡教訓

Sora 的退場恰好印證了主題一的核心論斷：

不是 2D 路線走不通，而是 OpenAI 既沒有低成本算力（不像 Google），也沒有分發平台（不像字節/快手），結構性優勢一項都沒有。

三、《霍去病》：數據造假的警示

在討論 AI 影視的積極案例前，必須正視這個行業最危險的陷阱。

事件回顧

中國 AI 短劇《霍去病》在 2025 年兩岸社群瘋傳，號稱：

成本 3000 元人民幣
兩天製作完成
5 億播放量

被大量媒體吹捧為「AI 顛覆影視的標誌性事件」。

真相拆解

導演楊涵涵後來受訪承認，多數被媒體引用的數據是以訛傳訛或刻意誇大
「5 億播放量」極可能是話題標籤的流量加總灌水，將相關討論的總流量算進單一作品的觀看數
畫面細看之下，穿著、兵器、建築等細節與歷史嚴重不符
成本 3000 元的說法嚴重低估了前期準備、模型訓練、後期編輯的實際投入

為什麼這很危險

當資本和注意力被這類「數據造假式成功」吸引時：

投資者可能做出錯誤的投資決策
真正做紮實技術的團隊被忽視
整個行業的信譽受損

四、3D 路線案例：聚力維度——技術有料，但數字待驗證

公司背景

北京「聚力維度」創辦人趙天奇（北郵博士、清華博後），花了十二年走 3D 路線，開發「賽博導演」平台。

可驗證的部分 ✅

事項	驗證狀態
公司成立於 2016 年，持有 16 項發明專利	✅ 公開可查
2022 年入選北京市「專精特新」中小企業名錄	✅ 政府名錄可查
服務過央視數位主持人、中國移動研究院	✅ 有公開合作記錄
與華為雲聯合發布多模態 3D 視頻大模型	✅ 有新聞發布記錄
早期參與《尋龍訣》、《新警察故事》3D 轉製	✅ 可追溯

需要存疑的部分 ⚠️

宣稱	疑點
「效率提升 100 倍」「成本降至 1%」	全部來自公司單方面說法，無第三方驗證
「月產可達 1000 部」	無獨立產能驗證
「春節上線第一部短劇，首批 20 部」（2025 年初承諾）	截至目前找不到任何已上線作品的播放數據
「投入近兩億人民幣」	公開管道查不到具體融資記錄
員工僅 37-70 人，官網願景「實現通用人工智能」	規模與願景嚴重不匹配

判斷

趙天奇不像《霍去病》那樣是明確的數據造假。他更像是有真實技術基底、但商業宣傳傾向過度包裝的類型。專利和客戶是真的，但驚人的效率數字在沒有上市作品驗證前，應視為行銷話術。

五、微軟在 AI 影視的「零地位」

為什麼微軟完全缺席

當 Google 亮 Veo 3.1、字節推 Seedance、快手推 Kling 時，微軟在影音生成市場處於完全缺席狀態。

原因已在前面的主題中分析過：

微軟將影音 AI 全盤外包給 OpenAI → Sora 被砍 → 武器庫歸零
微軟沒有消費級娛樂分發平台（不像 YouTube / TikTok）
微軟是「生產力公司」，基因上不適合做泛娛樂內容

微軟在 AI 影視市場能做什麼？

微軟唯一能做的是在後台賣 API——通過 Azure 向影視工具提供算力。但這讓它永遠只能做「雲端批發商」，無法成為引領創作者生態的主導者。

六、AI 影視的三個生存條件

能在 AI 影視市場活下來的玩家，需要同時滿足：

算得起 — 自研晶片或極低成本算力
放得出 — 自有內容分發管道
真得了 — 作品經得起市場和觀眾檢驗，而不靠灌水數據

AI 影視的未來，不屬於晶片最多的公司，也不屬於最會吹的公司——而屬於最終讓觀眾願意付費的人。

👉 主題八：Xbox 的豪賭與危機

核心論點​

一、兩條路線的技術分野​

路線 A：2D 生成式（Sora / Veo / Seedance）​

路線 B：3D 世界模擬（聚力維度等）​

對比表​

二、2D 路線的最新戰局（截至 2026 年 3 月）​

Google Veo 3.1​

字節跳動 Seedance 2.0​

快手 Kling​

Sora 的死亡教訓​

三、《霍去病》：數據造假的警示​

事件回顧​

真相拆解​

為什麼這很危險​

四、3D 路線案例：聚力維度——技術有料，但數字待驗證​

公司背景​

可驗證的部分 ✅​

需要存疑的部分 ⚠️​

判斷​

五、微軟在 AI 影視的「零地位」​

為什麼微軟完全缺席​

微軟在 AI 影視市場能做什麼？​

六、AI 影視的三個生存條件​