IBM 推出第三代企業用 Granite 大型語言模型

IBM 最近宣佈推出第三代 Granite 大型語言模型(LLM),進一步擴充其企業 AI 業務。新一代模型包括 2B 和 8B 參數的通用模型,以及多個專家混合(MoE)模型和提升安全性的 Guardian 模型。

IBM 高級副總裁兼商務總監 Rob Thomas 表示,公司在生成式 AI 的業務已投放超過 20 億美元。新模型預計將可以支援客戶服務、IT 自動化、業務流程外判、應用程式開發和網絡安全等多個企業應用。IBM 研究部門主管 Dario Gil 強調,Granite 3.0 在訓練過程中使用了 12 萬億個標記的數據,包括多語言文本和代碼數據。這些模型將在 IBM 的 watsonX 服務以及 Amazon Bedrock、Amazon Sagemaker 和 Hugging Face 平台上提供。

IBM 聲稱 Granite 3.0 在多項任務上的表現比 Google、Anthropic 等競爭對手的最新模型優勝,其中特別在安全性和可信度,以及不同規模模型在推理成本方面都有優勢。IBM 還決定以 Apache 2.0 開源許可證發佈這些模型,為企業合作夥伴提供更大的靈活性。Thomas 表示,開源化容許社群貢獻,最終甚至可廣泛散佈,能夠大幅提升企業採用 AI 的速度。

來源:VentureBeat