Google DeepMind 宣佈開發模擬真實世界的 AI 模型

AI 模型近年不斷發展，對於多媒體處理和生成都已經逐漸純熟，不過要處理現實世界的物理變化等細節則尚有改進空間。最近 Google 就宣佈開發能夠模擬真實世界的模型，作為 DeepMind 的一部分。

新的開發計畫將由前 OpenAI Sora 影片生成工具共同負責人 Tim Brooks 所領導，Brooks 在 X 上表示，新團隊將與 Google 現有的 Gemini、Veo 和 Genie 等項目的團隊合作。而在招募文件中，團隊認為影片與多模態資料的 AI 訓練規模化，將會是通往通用人工智慧（AGI）的重大發展方向。新團隊將會集中於開發「實時互動生成」工具，與現有多模態模型例如 Gemini 等等進行整合，提供更全面的功能。

DeepMind has ambitious plans to make massive generative models that simulate the world. I'm hiring for a new team with this mission. Come build with us!https://t.co/pqvALtAvLs https://t.co/vtwgeXl9Dl

— Tim Brooks (@_tim_brooks) January 6, 2025

真實世界模擬的應用範圍相當廣泛，從視覺推理、模擬、規劃具身智能助理 (Embodied Agent)，到即時互動娛樂等都會用到這個技術。現時除了 Google 本身正在開發的 Genie 模型之外，其他「世界模型」還有 World Labs、Decart 和 Odyssey 等，預計可以用作生成互動多媒體內容例如遊戲和電影等，以及用作像真模擬，用於訓練機械人等技術。

來源：X

Google DeepMind 宣佈開發模擬真實世界的 AI 模型

Sam Altman：ChatGPT Pro 收費每月 200 美元仍然蝕錢

Capture.HK 於 2024 年間成功數碼化超過 100 萬張家庭相片

Google DeepMind 宣佈開發模擬真實世界的 AI 模型

you might also like

Google Project Genie 商業解構 : AI 即時成生互動世界模型 兩句生成 GTA6 世界並可遊覧

波士頓動力夥 Google 研發 AI 機械人 現代汽車將採用次世代 Atlas 機械人協助生產

xAI 開發世界模型技術 挑戰 Meta 與 Google 人工智能霸權

Google DeepMind 推出 CodeMender AI 代理 可自動修補軟件漏洞並重寫程式碼

NVIDIA 推出 Cosmos 機械人平台 具備記憶和物理理解能力加速機械人開發

Google Project Genie 商業解構 : AI 即時成生互動世界模型兩句生成 GTA6 世界並可遊覧

波士頓動力夥 Google 研發 AI 機械人　現代汽車將採用次世代 Atlas 機械人協助生產

xAI 開發世界模型技術　挑戰 Meta 與 Google 人工智能霸權

Google DeepMind 推出 CodeMender AI 代理　可自動修補軟件漏洞並重寫程式碼

NVIDIA 推出 Cosmos 機械人平台　具備記憶和物理理解能力加速機械人開發