close
人工智能

Hugging Face 推開源機械人 AI 模型 SmolVLA 運行門檻大降成中小企機遇

AI 開發平台 Hugging Face 本週推出名為 SmolVLA 的開源機械人 AI 模型,大幅減低 AI 模型的運作門檻,令建立精密機械人項目變得更容易。這個擁有 4.5 億參數的模型在虛擬和現實環境中的表現均超越體積更大的模型,只需要消費級 GPU 甚至 MacBook 已經可以運作。

輕量級模型實現高效能

SmolVLA 使用來自 LeRobot Community Datasets 的數據進行訓練,這些是在 Hugging Face AI 開發平台上共享的專門標記機械人數據集。參數(有時稱為「權重」)是模型的內部組件,指導其行為。

Hugging Face 在博客文章中寫道:「SmolVLA 期望將視覺語言動作(VLA)模型的使用民主化,並加速研究邁向通用機械人代理。SmolVLA 除了是一個輕量但功能強大的模型,也是訓練和評估通用機械人技術的方法。」

這個模型支援「非同步推理堆疊」,Hugging Face 表示這容許模型將機械人動作的處理與其視覺和聽覺處理分離。公司在博客文章中解釋:「因為這種分離,機械人能夠在快速變化的環境中更快速地回應。」

SmolVLA 是 Hugging Face 快速擴展努力的一部分,公司期望建立低成本機械人硬件和軟件生態系統。去年,該公司推出 LeRobot,一個專注於機械人的模型、數據集和工具集合。最近,Hugging Face 收購了法國機械人初創公司 Pollen Robotics,並推出幾個價格實惠的機械人系統供購買,包括人形機械人。

開源機械人競賽升溫

SmolVLA 現可從 Hugging Face 下載。X 平台上已有用戶聲稱使用該模型控制第三方機械臂,顯示模型的實用性和易用性。

Hugging Face 並非新興開源機械人競賽中的唯一參與者。Nvidia 擁有一系列開源機械人工具,初創公司 K-Scale Labs 正在建構所謂「開源人形機械人」的組件。該領域其他強大公司包括 Dyna Robotics、Jeff Bezos 支持的 Physical Intelligence 和 RLWRLD。

開源機械人技術的發展為研究人員、愛好者和小型企業帶來新機遇。過去,開發機械人需要昂貴的專用硬件和複雜的軟件,現在任何擁有基本計算設備的人都能實驗機械人技術。

推動創新與教育發展

SmolVLA 的推出標誌著機械人技術民主化的重要一步。學校和教育機構能夠以較低成本將機械人學納入課程,學生可以在個人設備上學習和實驗先進的機械人概念。

企業也能受惠於這些發展。中小企業現在可以探索機械人自動化解決方案,而毋須投資數十萬港元購買專用系統。這可能加速各行業採用機械人技術,從製造業到服務業都能找到創新應用。

隨著更多開源工具和模型面世,預期機械人開發社群將快速增長。開發者能夠分享想法、改進現有模型,並創造新的應用。這種協作方式可能加速機械人技術的進步速度。

未來開源機械人運動可能徹底改變我們與機械人互動的方式。從家用助手到工業應用,更容易獲取和負擔得起的機械人技術將創造無數可能性。SmolVLA 只是個開始,隨著技術持續發展,我們可能很快看到機械人成為日常生活的普遍部分。

來源:Hugging Face