Microsoft 雖然與 OpenAI 深入合作,不過本身自己也有開發 AI 模型,最近他們就擴充了旗下 Phi 系列的語言與多模態 AI 模型,表現甚至超越 OpenAI 的 GPT-4o。
三款新的 Phi 3.5 模型包括 38.2 億參數的 Phi-3.5-mini-instruct,專為受限的運算環境而設計,適合處理代碼生成、數學問題解決及邏輯推理等需要強大推理能力的任務;419 億參數的 Phi-3.5-MoE-instruct,採用了「專家混合」(Mixture of Experts)的架構,專為更強大的推理任務設計;以及 41.5 億參數的 Phi-3.5-vision-instruct,則將文本與圖像處理功能結合,適用於圖像理解、光學字符識別以及影片摘要等多模態任務。
這些模型已經在 Hugging Face 平台提供,開發者可以下載、使用及微調自訂,在 Microsoft 品牌下以 MIT 許可證公開發行,允許商業使用及無限制的修改。三款模型在多項第三方基準測試中表現優秀,在部分情況下更超越了其他 AI 競爭對手,包括 Google 的 Gemini 1.5 Flash、Meta 的 Llama 3.1 以及 OpenAI 的 GPT-4o。而由於模型為開源許可,其推出也深受 AI 開發者社群歡迎。在開源 AI 模型日漸進步的情況下,閉源模型開發商會如何跟進,則仍然值得繼續觀察。
來源:VentureBeat