NVIDIA 推出自家開源模型 NVLM 1.0 　聲稱達到 GPT-4 級先進水平

NVIDIA 在 AI 硬件方面已經佔有很大的優勢，而他們在 AI 模型方面其實也有積極開發。最近他們就推出了開源 AI 模型 NVLM 1.0，據稱有相當優秀的表現。

這個 NVLM 1.0 為大型多模態語言模型家族，其中最強勁的是 720 億參數的 NVLM-D-72B，NVIDIA 表示，這個模型在視覺語言任務上達到了最先進的水平，與領先的專有模型（如 GPT-4）和開源模型相媲美。

研究人員提供的例子示範了模型在解釋網上迷因、分析圖像和逐步解決數學問題等方面都有不錯的結果。而且 NVLM-D-72B 在經過多模態訓練後，其純文字任務的表現亦有所提升，在關鍵文本基準測試中，平均提高了 4.3 個百分點的準確率。