主題七:AI 影視的路線之爭——2D 生成 vs 3D 世界模擬
核心論點
Sora 的退場不代表 AI 影視已死——而是宣告了:靠暴力算力「憑空生成」影片的商業模式,在沒有低成本算力和分發平台的前提下走不通。 AI 影視的未來取決於技術路線選擇、成本結構、和分發管道三者的組合。
一、兩條路線的技術分野
路線 A:2D 生成式(Sora / Veo / Seedance)
原理: 擴散模型(Diffusion Model)或變形器架構(Transformer),直接從文字描述「畫」出影片的每一個像素。本質上是一個極其複雜的「預測下一幀圖像」的過程。
優勢:
- 使用門檻極低——任何人只要會打字就能生成影片
- 視覺震撼度高,能產出風格化的驚艷畫面
- 迭代速度快,模型能力每年大幅提升
致命弱點:
- 角色不一致: 同一角色在不同鏡頭間的外貌、服裝、身材可能完全不同
- 時空不連續: 缺乏物理法則的理解,鏡頭之間的空間和時間關係混亂
- 算力黑洞: 每次生成都是從零開始的海量運算,無法重複利用
- 創作不可控: 像抽獎——不滿意就重新生成,無法精確編輯特定元素
路線 B:3D 世界模擬(聚力維度等)
原理: 先建構一個 3D 虛擬世界(場景、角色、光影、物理規則),再讓 AI 在這個世界裡「拍攝」。本質上是傳統 CG 電影製作流程的 AI 加速版。
優勢:
- 角 色高度一致: 使用固定的 3D 模型,角色外貌不會變化
- 物理法則正確: 3D 引擎天然模擬重力、光影、碰撞
- 資產可重複使用: 場景和角色建模完成後可反覆使用,邊際成本下降
- 創作可控: 可精確調整鏡頭運動、燈光、演員表演
弱點:
- 技術門檻高,目前成熟度遠不及 2D 生成式
- 3D 資產建模本身仍需大量人工或 AI 輔助
- 內容品質(特別是角色表情和動態)仍待突破
對比表
| 2D 生成式 | 3D 世界模擬 | |
|---|---|---|
| 適合內容 | 短影音、概念展示、社群素材 | 連續劇、動畫、工業級影視 |
| 算力需求 | 極高,每次生成都燒 | 相對可控,資產可復用 |
| 角色一致性 | 弱 | 強 |
| 產品成熟度 | 高(多家已商用) | 低(多在研發或早期商用) |
| 商業驗證 | 部分驗證(快手 Kling ARR 2.4 億美元) | 幾乎未驗證 |
二、2D 路線的最新戰局(截至 2026 年 3 月)
Google Veo 3.1
- 2026 年 1 月發布,已通過 Gemini API、Vertex AI 和 Gemini 應用向開發者與消費者開放
- 支援原生音訊同步(對白、環境音、音效一併生成)、4K upscaling、原生直式影片
- 已整合進 YouTube Shorts 和 Google Ads(Asset Studio),讓創作者和廣告主直接用 AI 生成影片
- 支援文字轉影片、圖片轉影片,電影級幀率與物理模擬
- 結構性優勢: 自研 TPU 壓成本 + YouTube / Google Ads 做分發 → 同樣走 2D 路線,在 Google 手上走得起來
字節跳動 Seedance 2.0
- 2026 年 3 月開始在 CapCut(剪映國際版)上分批上線
- 首批市場:巴西、印尼、墨西哥、菲律賓、泰國、越南
- 支援原生音視頻同步、角色一致性、多鏡頭生成
- 結構性優勢: 字節有 TikTok/抖音的超級分發平台 → 即使算力是租的,也能靠分發撐住
快手 Kling
- 2025 年底 ARR 超過 2.4 億美元,用戶突破 6000 萬
- 推出 Omni 系列模型(Video O1、2.6 等),強調多模態能力
- 已深度整合進行銷、電商、影視的專業工作流
- 結構性優勢: 快手平台 + 激進的商業化策略
Sora 的死亡教訓
Sora 的退場恰好印證了主題一的核心論斷:
不是 2D 路線走不通,而是 OpenAI 既沒有低成本算力(不像 Google),也沒有分發平台(不像字節/快手),結構性優勢一項都沒有。
三、《霍去病》:數據造假的警示
在討論 AI 影視的積極案例前,必須正視這個行業最危險的陷阱。
事件回顧
中國 AI 短劇《霍去病》在 2025 年兩岸社群瘋傳,號稱:
- 成本 3000 元人民幣
- 兩天製作完成
- 5 億播放量
被大量媒體吹捧為「AI 顛覆影視的標誌性事件」。
真相拆解
- 導演楊涵涵後來受訪承認,多數被媒體引用的數據是以訛傳訛或刻意誇大
- 「5 億播放量」極可能是話題標籤的流量加總灌水,將相關討論的總流量算進單一作品的觀看數
- 畫面細看之下,穿著、兵器、建築等細節與歷史嚴重不符
- 成本 3000 元的說法嚴重低估了前期準備、模型訓練、後期編輯的實際投入
為什麼這很危險
當資本和注意力被這類「數據造假式成功」吸引時:
- 投資者可能做出錯誤的投資決策
- 真正做紮實技術的團隊被忽視
- 整個行業的信譽受損
四、3D 路線案例:聚力維度——技術有料,但數字待驗證
公司背景
北京「聚力維度」創辦人趙天奇(北郵博士、清華博後),花了十二年走 3D 路線,開發「賽博導演」平台。
可驗證的部分 ✅
| 事項 | 驗證狀態 |
|---|---|
| 公司成立於 2016 年,持有 16 項發明專利 | ✅ 公開可查 |
| 2022 年入選北京市「專精特新」中小企業名錄 | ✅ 政府名錄可查 |
| 服務過央視數位主持人、中國移動研究院 | ✅ 有公開合作記錄 |
| 與華為雲聯合發布多模態 3D 視頻大模型 | ✅ 有新聞發布記錄 |
| 早期參與《尋龍訣》、《新警察故事》3D 轉製 | ✅ 可追溯 |
需要存疑的部分 ⚠️
| 宣稱 | 疑點 |
|---|---|
| 「效率提升 100 倍」「成本降至 1%」 | 全部來自公司單方面說法,無第三方驗證 |
| 「月產可達 1000 部」 | 無獨立產能驗證 |
| 「春節上線第一部短劇,首批 20 部」(2025 年初承諾) | 截至目前找不到任何已上線作品的播放數據 |
| 「投入近兩億人民幣」 | 公開管道查不到具體融資記錄 |
| 員工僅 37-70 人,官網願景「實現通用人工智能」 | 規模與願景嚴重不匹配 |
判斷
趙天奇不像《霍去病》那樣是明確的數據造假。他更像是有真實技術基底、但商業宣傳傾向過度包裝的類型。專利和客戶是真的,但驚人的效率數字在沒有上市作品驗證前,應視為行銷話術。
五、微軟在 AI 影視的「零地位」
為什麼微軟完全缺席
當 Google 亮 Veo 3.1、字節推 Seedance、快手推 Kling 時,微軟在影音生成市場處於完全缺席狀態。
原因已在前面的主題中分析過:
- 微軟將影音 AI 全盤外包給 OpenAI → Sora 被砍 → 武器庫歸零
- 微軟沒有消費級娛樂分發平台(不像 YouTube / TikTok)
- 微軟是「生產力公司」,基因上不適合做泛娛樂內容
微軟在 AI 影視市場能做什麼?
微軟唯一能做的是在後台賣 API——通過 Azure 向影視工具提供算力。但這讓它永遠只能做「雲端批發商」,無法成為引領創作者生態的主導者。
六、AI 影視的三個生存條件
能在 AI 影視市場活下來的玩家,需要同時滿足:
- 算得起 — 自研晶片或極低成本算力
- 放得出 — 自有內容分發管道
- 真得了 — 作品經得起市場和觀眾檢驗,而不靠灌水數據
AI 影視的未來,不屬於晶片最多的公司,也不屬於最會吹的公司——而屬於最終讓觀眾願意付費的人。