OpenAI 發佈多語言數據集使 AI 評估可對應更多語言協助開發

OpenAI 早前在 Hugging Face 上發佈了一個多語言大規模多任務語言理解(MMMLU)數據集,可用於評估語言模型在 14 種語言中的表現,包括阿拉伯文、德文、簡體中文、日文和韓文等。

這個 MMMLU 數據集是對於現時流行的大規模多任務語言理解(MMLU)基準的擴充,MMLU 只能夠以英語測試 AI 系統在 57 個學科範疇的知識,新的數據集就可以對應更多的語言。值得一提的是,OpenAI 是透過利用專業人士的翻譯來建立 MMMLU 數據集,而不是 AI 自動機器翻譯,確保比類似自動翻譯數據集更準確。

除了 MMMLU 數據集之外,OpenAI 還推出 OpenAI Academy 進一步履行其對全球 AI 可及性的承諾。這個 AI 學院將會向開發人員和使命組織提供支援,這些組織利用 AI 解決特別是在低收入和中等收入國家社區中的重要問題。學院將提供培訓、技術指導和價值 100 萬美元的 API 用量,以確保當地 AI 人才能夠獲得最先進的資源。

來源:VentureBeat