阿里雲旗下通義萬相於 2025 年 9 月 19 日正式開源全新動作生成模型 Wan2.2-Animate,標誌著 AI 動作捕捉技術邁入低成本普及時代。該模型可基於人物圖片和參考影片生成高品質人物動作影片,將影片角色的動作與表情完美遷移到圖片角色中,為短影片創作、舞蹈模板生成、動漫製作等領域提供前所未有的創作工具。通義萬相系列模型在 HuggingFace 與 ModelScope 平台的總下載量已突破 690 萬次,反映出市場對 AI 影片生成技術的強烈需求。本文將深入分析該技術的三大核心優勢:突破性的動作遷移能力、顛覆傳統動捕行業的成本效益,以及在激烈競爭中確立的技術領先地位。
技術突破實現精準動作復刻
Wan2.2-Animate 模型基於 Animate Anyone 架構全面升級,支援「角色模仿」與「角色扮演」兩種核心模式。角色模仿功能可將參考影片中的動作與表情精確遷移至靜態圖片角色,實現復刻舞蹈、高難度肢體動作、影視劇表演等複雜場景的動態重現。該模型採用先進的時空全注意機制,能夠更準確地模擬現實世界的複雜動態,有效解決傳統 AI 影片生成中常見的肢體扭曲與物理定律違背問題。阿里雲提供標準版與專業版兩種服務模式,標準版每秒收費 0.4 元人民幣 (約港幣 HK0.43),專業版收費0.6元人民幣(約港幣HK0.65),滿足不同精度需求的用戶群體。
官方介紹影片
專家看好 AI 動捕替代傳統方案
影視製作專家越田表示,雖然近年 AI 動作捕捉工具精準度表現不錯,但在脊椎偵測、腳步滑移、人體腳尖數據捕捉等細節方面仍存在問題。然而通義萬相團隊通過引入參數共享機制與創新的影片編解碼方案,有效提升模型性能並降低訓練成本。機器學習專家認為 AI 處理動作捕捉數據能夠提升動畫流暢度,縮短渲染時間,在《猩球崛起》等影片製作中已展現出色表現。青瞳視覺動捕專家指出 AI 動作捕捉工具雖在某些應用場景具有可行性,但考量修正問題所需的時間與成本,傳統 VICON 技術在高精度需求領域仍具無可動搖的優勢。
行業分析師預測顛覆性影響
根據 AI 產品榜數據顯示,即夢 AI 以 173.57% 的月活增速位居 AI 影片應用增速榜第 5 位,月活規模達 2,037 萬,而競爭對手可靈 AI 增速僅 36.44%。影視技術分析師表示 AIGC 加持下的動作捕捉正以驚人速度發展,這項技術變革將賦予草根創作者更多創作力,帶來內容數量增長並引起整個產業質變。Amazon 開發者平台專家 Tom Godden 認為,生成式 AI 是與印刷機、電力等歷史創新相媲美的顛覆性技術,當前技術積累已達到新突破點。業內人士指出 AI 影片生成賽道仍處於「技術突破期」,意味著競爭格局尚未定型,為新技術創造了巨大機遇空間。
技術發展脈絡突顯競爭優勢
阿里巴巴自 2025 年 2 月開源 Wan2.1 系列模型以來,已連續開源文生影片、圖生影片、首尾幀生影片、全能編輯、音訊生影片等多款模型,在開源社區的總下載量超過 2,000 萬。通義萬相在權威評測榜單 VBench 中以總分 84.7% 的成績奪得第一,超越混元、海螺 AI、Gen3、Pika 等國內外主流影片生成模型。相比之下,競爭對手百度於 2025 年 7 月推出首個圖生影片大模型 MuseSteamer,快手發布可靈 2.0 影片生成模型,字節跳動 Seed 團隊發布 Seedream 3.0 技術報告。然而通義萬相率先實現中文文字生成能力,成為首個同時支援中英文文字特效生成的影片生成模型,在廣告設計與短影片創作領域確立了差異化競爭優勢。
通義萬相 Wan2.2-Animate 模型的推出,標誌著 AI 動作生成技術從實驗室走向大規模商業應用的關鍵節點。隨著成本大幅降低與操作門檻的顯著下降,傳統需要昂貴動捕裝置的影視製作流程將面臨根本性變革。預計未來 12 個月內,將有更多中小型內容創作者採用此類 AI 工具,推動影視、遊戲、廣告等行業的創作民主化進程。這一技術趨勢將如何重塑數碼內容創作生態,值得業界持續關注。
玩家 DIY 示範影片
資料來源: