NVIDIA 在 AI 硬件方面已經佔有很大的優勢,而他們在 AI 模型方面其實也有積極開發。最近他們就推出了開源 AI 模型 NVLM 1.0,據稱有相當優秀的表現。
這個 NVLM 1.0 為大型多模態語言模型家族,其中最強勁的是 720 億參數的 NVLM-D-72B,NVIDIA 表示,這個模型在視覺語言任務上達到了最先進的水平,與領先的專有模型(如 GPT-4)和開源模型相媲美。
研究人員提供的例子示範了模型在解釋網上迷因、分析圖像和逐步解決數學問題等方面都有不錯的結果。而且 NVLM-D-72B 在經過多模態訓練後,其純文字任務的表現亦有所提升,在關鍵文本基準測試中,平均提高了 4.3 個百分點的準確率。
今次 NVLM 1.0 的發佈,對於開源 AI 社群來說是另一個好消息,提供更多強勁的模型選擇,加速 AI 技術發展。
來源:VentureBeat