Meta 發佈最新版本 Llama 3 據稱性能超越 Gemini

大型語言模型競爭激烈，Meta 早前終於發佈了其 Llama 系列的最新版本 Llama 3，據稱在不同方面的表現都相當出色，甚至超越了 Google 的 Gemini Pro 1.5。

Meta 最新發佈的 Llama 3 有兩個版本，分別有 80 億和 700 億個參數，據稱比起上代模型有了顯著改進，除了提供更多樣化的回答，也減少了拒絕回答問題的情況，有更好的推理能力，並增強了代碼編寫能力。據 Meta 表示，Llama 3 比 Google 的 Gemma 和 Gemini、Mistral 7B 和 Anthropic 的 Claude 3 等競爭對手在某些基準測試中有更佳的表現。例如在評估常識的 MMLU 基準測試中，80 億參數版本的 Llama 3 的表現超越 Gemma 7B 和 Mistral 7B。而 70 億參數版本的 Llama 3 也略微勝過類似參數數量的 Gemini Pro 1.5。不過在 Meta 的資料中並沒有提及與 GPT-4 的比較結果。

Meta 除了一般的基準測試外，還利用一個新的數據集進行了人工評估，模擬現實世界中可能使用 Llama 3 的場景。該數據集包括 1,800 個提示，涵蓋建議、生成新意見、編碼、創意寫作等各種使用案例，為確保結果公正，模型開發團隊無法存取該數據集。結果評估員對 Llama 3 的評分高於其他競爭對手，包括 OpenAI 的 GPT-3.5 等等。

目前 Llama 3 已經在 AWS 等雲端服務平台上提供，之後會加入到 Hugging Face 等模型庫之中供選用。未來 Meta 計劃開發更大的模型來擴展 Llama 3 的能力，使其能夠理解更長的數據串，並執行圖像生成和音頻轉錄等多模態任務。這些更大的模型參數可能超過 4,000 億個，不過暫時未有推出的時間表。

來源：Meta