生成式 AI 模型的發展除了聊天機械人外,近來也有越來越多影片生成模型出現,OpenAI 最近就發表最新的影片生成模型 Sora,其效果相當像真流暢,進一步帶動這方面的技術競爭。
OpenAI 的 Sora 模型可以透過輸入文字或者圖片自動生成長達 60 秒的影片,從示範片段中可見,生成的影片無論在畫質、影片中物件的連貫性以及對人體和物理環境的描繪準確度都相當強勁,相對於 Runway、Pika 和 Stability AI 等初創公司的類似模型,以及 Google 的 Lumiere 模型等都有優勢。OpenAI 指,Sora 使用的技術是基於過往開發 DALL-E 和 GPT 系列模型的經驗,基於 Transformer 架構開發,能夠在流暢度和畫質上帶來極佳表現。
OpenAI 總裁 Sam Altman 表示,Sora 的公佈代表着 OpenAI 的一個「非凡時刻」,顯示他們的技術已經不只是 ChatGPT 和大型語言模型,對於其他多媒體內容也擁有強勁的技術實力。不過 OpenAI 亦提到,這樣的逼真影片生成工具如果被濫用有可能帶來嚴重的禍害,因此內部正在進行「Red Teaming」測試,以及將會加入 C2PA 元數據「數碼水印」方便辨別 AI 生成內容。Sora 模型暫時只對部分創作者提供早期測試,未來解決安全性和濫用問題之後將會進一步公開。
來源:OpenAI
影片來源:WSJ