Exo Labs 成功利用 Apple M4 裝置運作大型語言模型

除了大型雲端運算平台，在本機執行大型語言模型的需要也日漸增加，不過在消費者級數的產品上要順暢地執行這些模型有一定難度。最近 Exo Labs 就成功連接了幾部 M4 晶片的 Mac 電腦成為運算叢集，執行了大型語言模型。

Exo Labs 創辦人 Alex Cheema 表示，他連接了四部 Mac Mini M4 和一部 Macbook Pro M4 Max 成為運算叢集，成功執行了阿里巴巴的 Qwen 2.5 Coder-32B 模型。這套系統總價值約 5,000 美元，比單一 NVidia H100 GPU 的 25,000 至 30,000 美元售價，有着相當大的成本優勢。Cheema 指出，在本地運行 AI 模型不僅能節省成本，更能確保私隱和安全，無需依賴網路連線。

根據 Exo Labs 分享的數據，其 Apple M4 叢集可以以每秒 18 個 tokens 的速度運行 Qwen 2.5 Coder 32B，以每秒 8 個 tokens 的速度運行 Nemotron-70B。此外，兩部 Macbook Pro M3 的組合也能以每秒超過 5 個 tokens 的速度運行 Llama 3.1-405B 模型。Exo Labs 計劃下星期推出免費的基準測試網站，提供單一裝置和多裝置配置的詳細比較，協助用戶根據需求和預算選擇最佳解決方案。

來源：VentureBeat

Exo Labs 成功利用 Apple M4 裝置運作大型語言模型

Synology Solution Day 2024 精彩落幕　超過 240 位企業 IT 共同探索最新資料管理趨勢

FTC 據報將針對 Microsoft 雲端產品營銷手法進行反壟斷調查

Exo Labs 成功利用 Apple M4 裝置運作大型語言模型

you might also like

Google AI 漏洞獵人成功運作 網絡安全防禦邁進 AI 時代

AI 模型思考時間延長反降效能 Anthropic 研究顛覆業界認知

Meta 拒簽歐盟 AI 實踐守則 指控過度監管阻礙先進模型發展

Microsoft 斥資 40 億美元推 AI 教育計劃 5 年培訓 2000 萬人應對職場變革

傳 Apple AI 模型主管跳槽 Meta 年薪數千萬美元挖角成功

Google AI 漏洞獵人成功運作　網絡安全防禦邁進 AI 時代

AI 模型思考時間延長反降效能　Anthropic 研究顛覆業界認知

Meta 拒簽歐盟 AI 實踐守則　指控過度監管阻礙先進模型發展

Microsoft 斥資 40 億美元推 AI 教育計劃　5 年培訓 2000 萬人應對職場變革

傳 Apple AI 模型主管跳槽 Meta　年薪數千萬美元挖角成功