close
人工智能

Meta 進軍商業 AI 服務市場 與 Cerebras Systems 合作推出 Llama API

Meta 今日在其首屆 LlamaCon 開發者大會上宣佈與 Cerebras Systems 合作,為其新的 Llama API 提供支援,為開發者提供比傳統基於 GPU 解決方案快至 18 倍的推理速度。此舉標誌著 Meta 正式進入 AI 運算銷售業務,將其廣受歡迎的開源 Llama 模型轉變為商業服務,為 AI 生態系統帶來重大變革。

Meta 的新服務最顯著的優勢在於 Cerebras 專業 AI 晶片提供的驚人速度提升。根據 Artificial Analysis 的基準測試,Cerebras 系統為 Llama 4 Scout 提供每秒超過 2,600 個 Token 的處理能力,相比之下 ChatGPT 約為每秒 130 個 Token,DeepSeek 約為每秒 25 個 Token。Cerebras 高級主管 James Wang 解釋道:「如果僅在 API 與 API 基礎上比較,Gemini 和 GPT 都是很棒的模型,但它們都以 GPU 速度運行,大約每秒 100 個 Token。對於聊天而言,每秒 100 個 Token 還可以,但對於推理來說非常慢。對於代理來說非常慢。人們今天正在為此而苦苦掙扎。」

這種速度優勢使以前不切實際的全新應用類別成為可能,包括實時代理、低延遲對話語音系統、互動式代碼生成和即時多步推理——所有這些都需要鏈接多個大型語言模型調用,現在可以在幾秒鐘內而非幾分鐘內完成。Llama API 代表了 Meta AI 從主要作為模型提供者轉向成為全方位 AI 基礎架構公司。透過提供 API 服務,Meta 為其 AI 投資創造收入流,同時保持對開放模型的承諾。Wang 在新聞發佈會上指出:「Meta 現在進入了銷售 Token 的業務,這對美國的 AI 生態系統來說很好。」

Cerebras 將透過其分佈在北美各地的數據中心網絡為 Meta 的新服務提供動力,包括達拉斯、俄克拉荷馬、明尼蘇達、蒙特利爾和加州的設施。業務安排遵循「傳統運算供應商對超大規模企業」的模式,類似於 Nvidia 向主要雲端服務供應商提供硬件的方式。

Meta 進一步挑戰 AI 市場

Meta 進入推理 API 市場帶來的超高性能指標可能顛覆由 OpenAI、Google 和 Anthropic 主導的現有秩序。對企業而言,高速推理使以前受限於性能的 AI 應用成為可能。企業可以開發更加複雜的 AI 代理系統,這些系統能夠執行多步推理而不會讓用戶等待太久。特別是需要連續多個 AI 呼叫的業務流程現在可以在幾秒鐘內完成,而不是幾分鐘,顯著提升用戶體驗。

Meta 的開放模式為企業提供了更大的靈活性,API 將提供微調和評估工具,允許開發人員生成數據、對其進行訓練並測試自訂模型的質量。Meta 強調不會使用客戶數據來訓練自己的模型,使用 Llama API 構建的模型可以轉移到其他主機——這與一些競爭對手更封閉的方法形成明顯區別。

此外,Meta 的進入可能引發 AI 推理市場的價格競爭。擁有自己的數據中心基礎設施和龐大用戶群的 Meta 有能力以更具競爭力的價格提供服務,可能迫使其他供應商重新評估其定價策略。企業應密切關注行業動態,尋找最具成本效益的服務供應商。企業應考慮速度對其特定 AI 應用的重要性。對於要求即時回應的客戶服務、實時分析或互動式系統,Meta 的高速推理服務可能具有顯著優勢。企業應評估其應用需求,並相應選擇合適的 API 供應商。

平衡開源和商業利益

Meta 與 Cerebras 的合作標誌著 AI 行業的幾個關鍵轉變。首先,速度正成為 AI 服務的核心競爭優勢,而不僅僅是一個次要功能。正如 Meta 的選擇所表明的:在 AI 的下一階段,重要的不僅是模型知道什麼,還有它們能多快思考。我們可能看到專用 AI 硬件的崛起,以替代通用 GPU。Cerebras 的晶片專為 AI 工作負載設計,提供顯著的性能優勢。隨著 AI 運算需求的持續增長,我們可能會看到更多專用硬件解決方案的出現和採用。

同時,開源模型與商業服務的結合代表了一種新的商業模式,Meta 透過開源其模型建立了大量開發者社區,然後提供高性能基礎設施來運行這些模型,創造了一種平衡開放性和商業利益的方法。現時 AI 推理市場正日益分化為不同的性能層級,Meta 和 Cerebras 的服務針對需要極速推理的高端應用,而其他服務可能專注於成本效益或其他差異化因素。這種分層將為企業提供更多選擇,以匹配其特定需求和預算。

Llama API 目前作為有限預覽版提供,Meta 計劃在未來幾週和幾個月內更廣泛地推出。對於希望利用這一新興技術的企業,現在是時候開始評估其潛在應用和優勢。隨著 AI 服務市場的持續演變,保持靈活性並願意探索新選項將是成功的關鍵。在推理速度成為競爭優勢的世界中,Meta 的新服務可能成為許多企業 AI 策略的重要組成部分。

來源:VentureBeat

Tags : LLaMaMeta
Antony Shum

The author Antony Shum