從圖像自動生成會動的影片,雖然比用文字生成圖像複雜得多,但已經逐漸可以實現。由 Stability AI 推出的 Stable Video Diffusion 模型最近終於加入到 API 之中,可以在第三方平台上應用。
著名文字至圖像生成模型 Stable Diffusion 背後的開發商 Stability AI 最近宣佈其圖像至影片模型 Stable Video Diffusion (SVD) 開始接受 API 存取,第三方開發者能夠將這個影片生成功能整合到各自的應用程式、網站、軟件或者服務中。Stability AI 強調,他們針對模型進行精簡,使其可以整合在不同的應用方式中。
據稱 SVD API 可以平均在 41 秒內生成 2 秒鐘的影片,每秒 25 格。這功能適合建立短片,例如內含特定資訊或流行潮語的 GIF 等等。目前類似的模型還有 Runway 和 Pika Labs 的產品,不過這些都要求用戶在其網站和應用程式直接使用影片生成工具,今次 SVD 提供 API 存取,則令其應用範疇更加龐大。其新版本更提供佈局、分辨率、移動幅度以及基於種子的可重複或隨機生成控制等選項,改善精確度。
來源:Stability AI