AI 開發平台 Hugging Face 本週推出名為 SmolVLA 的開源機械人 AI 模型,大幅減低 AI 模型的運作門檻,令建立精密機械人項目變得更容易。這個擁有 4.5 億參數的模型在虛擬和現實環境中的表現均超越體積更大的模型,只需要消費級 GPU 甚至 MacBook 已經可以運作。
輕量級模型實現高效能
SmolVLA 使用來自 LeRobot Community Datasets 的數據進行訓練,這些是在 Hugging Face AI 開發平台上共享的專門標記機械人數據集。參數(有時稱為「權重」)是模型的內部組件,指導其行為。
Hugging Face 在博客文章中寫道:「SmolVLA 期望將視覺語言動作(VLA)模型的使用民主化,並加速研究邁向通用機械人代理。SmolVLA 除了是一個輕量但功能強大的模型,也是訓練和評估通用機械人技術的方法。」
這個模型支援「非同步推理堆疊」,Hugging Face 表示這容許模型將機械人動作的處理與其視覺和聽覺處理分離。公司在博客文章中解釋:「因為這種分離,機械人能夠在快速變化的環境中更快速地回應。」
SmolVLA 是 Hugging Face 快速擴展努力的一部分,公司期望建立低成本機械人硬件和軟件生態系統。去年,該公司推出 LeRobot,一個專注於機械人的模型、數據集和工具集合。最近,Hugging Face 收購了法國機械人初創公司 Pollen Robotics,並推出幾個價格實惠的機械人系統供購買,包括人形機械人。
開源機械人競賽升溫
SmolVLA 現可從 Hugging Face 下載。X 平台上已有用戶聲稱使用該模型控制第三方機械臂,顯示模型的實用性和易用性。
Hugging Face 並非新興開源機械人競賽中的唯一參與者。Nvidia 擁有一系列開源機械人工具,初創公司 K-Scale Labs 正在建構所謂「開源人形機械人」的組件。該領域其他強大公司包括 Dyna Robotics、Jeff Bezos 支持的 Physical Intelligence 和 RLWRLD。
開源機械人技術的發展為研究人員、愛好者和小型企業帶來新機遇。過去,開發機械人需要昂貴的專用硬件和複雜的軟件,現在任何擁有基本計算設備的人都能實驗機械人技術。
推動創新與教育發展
SmolVLA 的推出標誌著機械人技術民主化的重要一步。學校和教育機構能夠以較低成本將機械人學納入課程,學生可以在個人設備上學習和實驗先進的機械人概念。
企業也能受惠於這些發展。中小企業現在可以探索機械人自動化解決方案,而毋須投資數十萬港元購買專用系統。這可能加速各行業採用機械人技術,從製造業到服務業都能找到創新應用。
隨著更多開源工具和模型面世,預期機械人開發社群將快速增長。開發者能夠分享想法、改進現有模型,並創造新的應用。這種協作方式可能加速機械人技術的進步速度。
未來開源機械人運動可能徹底改變我們與機械人互動的方式。從家用助手到工業應用,更容易獲取和負擔得起的機械人技術將創造無數可能性。SmolVLA 只是個開始,隨著技術持續發展,我們可能很快看到機械人成為日常生活的普遍部分。
來源:Hugging Face