Stability AI 推出圖像至影片生成模型 Stable Video Diffusion API

從圖像自動生成會動的影片，雖然比用文字生成圖像複雜得多，但已經逐漸可以實現。由 Stability AI 推出的 Stable Video Diffusion 模型最近終於加入到 API 之中，可以在第三方平台上應用。

著名文字至圖像生成模型 Stable Diffusion 背後的開發商 Stability AI 最近宣佈其圖像至影片模型 Stable Video Diffusion (SVD) 開始接受 API 存取，第三方開發者能夠將這個影片生成功能整合到各自的應用程式、網站、軟件或者服務中。Stability AI 強調，他們針對模型進行精簡，使其可以整合在不同的應用方式中。

據稱 SVD API 可以平均在 41 秒內生成 2 秒鐘的影片，每秒 25 格。這功能適合建立短片，例如內含特定資訊或流行潮語的 GIF 等等。目前類似的模型還有 Runway 和 Pika Labs 的產品，不過這些都要求用戶在其網站和應用程式直接使用影片生成工具，今次 SVD 提供 API 存取，則令其應用範疇更加龐大。其新版本更提供佈局、分辨率、移動幅度以及基於種子的可重複或隨機生成控制等選項，改善精確度。

來源：Stability AI

Next Read: 人工智能驅動的 2024 年科技趨勢 »