跳至主要内容

主題七:AI 影視的路線之爭——2D 生成 vs 3D 世界模擬

核心論點

Sora 的退場不代表 AI 影視已死——而是宣告了:靠暴力算力「憑空生成」影片的商業模式,在沒有低成本算力和分發平台的前提下走不通。 AI 影視的未來取決於技術路線選擇、成本結構、和分發管道三者的組合。


一、兩條路線的技術分野

路線 A:2D 生成式(Sora / Veo / Seedance)

原理: 擴散模型(Diffusion Model)或變形器架構(Transformer),直接從文字描述「畫」出影片的每一個像素。本質上是一個極其複雜的「預測下一幀圖像」的過程。

優勢:

  • 使用門檻極低——任何人只要會打字就能生成影片
  • 視覺震撼度高,能產出風格化的驚艷畫面
  • 迭代速度快,模型能力每年大幅提升

致命弱點:

  • 角色不一致: 同一角色在不同鏡頭間的外貌、服裝、身材可能完全不同
  • 時空不連續: 缺乏物理法則的理解,鏡頭之間的空間和時間關係混亂
  • 算力黑洞: 每次生成都是從零開始的海量運算,無法重複利用
  • 創作不可控: 像抽獎——不滿意就重新生成,無法精確編輯特定元素

路線 B:3D 世界模擬(聚力維度等)

原理: 先建構一個 3D 虛擬世界(場景、角色、光影、物理規則),再讓 AI 在這個世界裏「拍攝」。本質上是傳統 CG 電影製作流程的 AI 加速版。

優勢:

  • 角色高度一致: 使用固定的 3D 模型,角色外貌不會變化
  • 物理法則正確: 3D 引擎天然模擬重力、光影、碰撞
  • 資產可重複使用: 場景和角色建模完成後可反覆使用,邊際成本下降
  • 創作可控: 可精確調整鏡頭運動、燈光、演員表演

弱點:

  • 技術門檻高,目前成熟度遠不及 2D 生成式
  • 3D 資產建模本身仍需大量人工或 AI 輔助
  • 內容品質(特別是角色表情和動態)仍待突破

對比表

2D 生成式3D 世界模擬
適合內容短影音、概念展示、社羣素材連續劇、動畫、工業級影視
算力需求極高,每次生成都燒相對可控,資產可復用
角色一致性
產品成熟度高(多家已商用)低(多在研發或早期商用)
商業驗證部分驗證(快手 Kling ARR 2.4 億美元)幾乎未驗證

二、2D 路線的最新戰局(截至 2026 年 3 月)

Google Veo 3.1

  • 2026 年 1 月發布,已通過 Gemini API、Vertex AI 和 Gemini 應用向開發者與消費者開放
  • 支援原生音訊同步(對白、環境音、音效一併生成)、4K upscaling、原生直式影片
  • 已整合進 YouTube Shorts 和 Google Ads(Asset Studio),讓創作者和廣告主直接用 AI 生成影片
  • 支援文字轉影片、圖片轉影片,電影級幀率與物理模擬
  • 結構性優勢: 自研 TPU 壓成本 + YouTube / Google Ads 做分發 → 同樣走 2D 路線,在 Google 手上走得起來

字節跳動 Seedance 2.0

  • 2026 年 3 月開始在 CapCut(剪映國際版)上分批上線
  • 首批市場:巴西、印尼、墨西哥、菲律賓、泰國、越南
  • 支援原生音視頻同步、角色一致性、多鏡頭生成
  • 結構性優勢: 字節有 TikTok/抖音的超級分發平台 → 即使算力是租的,也能靠分發撐住

快手 Kling

  • 2025 年底 ARR 超過 2.4 億美元,用户突破 6000 萬
  • 推出 Omni 系列模型(Video O1、2.6 等),強調多模態能力
  • 已深度整合進行銷、電商、影視的專業工作流
  • 結構性優勢: 快手平台 + 激進的商業化策略

Sora 的死亡教訓

Sora 的退場恰好印證了主題一的核心論斷:

不是 2D 路線走不通,而是 OpenAI 既沒有低成本算力(不像 Google),也沒有分發平台(不像字節/快手),結構性優勢一項都沒有。


三、《霍去病》:數據造假的警示

在討論 AI 影視的積極案例前,必須正視這個行業最危險的陷阱。

事件回顧

中國 AI 短劇《霍去病》在 2025 年兩岸社羣瘋傳,號稱:

  • 成本 3000 元人民幣
  • 兩天製作完成
  • 5 億播放量

被大量媒體吹捧為「AI 顛覆影視的標誌性事件」。

真相拆解

  1. 導演楊涵涵後來受訪承認,多數被媒體引用的數據是以訛傳訛或刻意誇大
  2. 「5 億播放量」極可能是話題標籤的流量加總灌水,將相關討論的總流量算進單一作品的觀看數
  3. 畫面細看之下,穿着、兵器、建築等細節與歷史嚴重不符
  4. 成本 3000 元的説法嚴重低估了前期準備、模型訓練、後期編輯的實際投入

為什麼這很危險

當資本和注意力被這類「數據造假式成功」吸引時:

  • 投資者可能做出錯誤的投資決策
  • 真正做紮實技術的團隊被忽視
  • 整個行業的信譽受損

四、3D 路線案例:聚力維度——技術有料,但數字待驗證

公司背景

北京「聚力維度」創辦人趙天奇(北郵博士、清華博後),花了十二年走 3D 路線,開發「賽博導演」平台。

可驗證的部分 ✅

事項驗證狀態
公司成立於 2016 年,持有 16 項發明專利✅ 公開可查
2022 年入選北京市「專精特新」中小企業名錄✅ 政府名錄可查
服務過央視數位主持人、中國移動研究院✅ 有公開合作記錄
與華為雲聯合發布多模態 3D 視頻大模型✅ 有新聞發布記錄
早期蔘與《尋龍訣》、《新警察故事》3D 轉製✅ 可追溯

需要存疑的部分 ⚠️

宣稱疑點
「效率提升 100 倍」「成本降至 1%」全部來自公司單方面説法,無第三方驗證
「月產可達 1000 部」無獨立產能驗證
「春節上線第一部短劇,首批 20 部」(2025 年初承諾)截至目前找不到任何已上線作品的播放數據
「投入近兩億人民幣」公開管道查不到具體融資記錄
員工僅 37-70 人,官網願景「實現通用人工智能」規模與願景嚴重不匹配

判斷

趙天奇不像《霍去病》那樣是明確的數據造假。他更像是有真實技術基底、但商業宣傳傾向過度包裝的類型。專利和客户是真的,但驚人的效率數字在沒有上市作品驗證前,應視為行銷話術。


五、微軟在 AI 影視的「零地位」

為什麼微軟完全缺席

當 Google 亮 Veo 3.1、字節推 Seedance、快手推 Kling 時,微軟在影音生成市場處於完全缺席狀態。

原因已在前面的主題中分析過:

  1. 微軟將影音 AI 全盤外包給 OpenAI → Sora 被砍 → 武器庫歸零
  2. 微軟沒有消費級娛樂分發平台(不像 YouTube / TikTok)
  3. 微軟是「生產力公司」,基因上不適合做泛娛樂內容

微軟在 AI 影視市場能做什麼?

微軟唯一能做的是在後台賣 API——通過 Azure 向影視工具提供算力。但這讓它永遠只能做「雲端批發商」,無法成為引領創作者生態的主導者。


六、AI 影視的三個生存條件

能在 AI 影視市場活下來的玩家,需要同時滿足:

  1. 算得起 — 自研晶片或極低成本算力
  2. 放得出 — 自有內容分發管道
  3. 真得了 — 作品經得起市場和觀眾檢驗,而不靠灌水數據

AI 影視的未來,不屬於晶片最多的公司,也不屬於最會吹的公司——而屬於最終讓觀眾願意付費的人。

👉 主題八:Xbox 的豪賭與危機