close
人工智能

OpenAI 推出 GPT-4.1 系列模型 減低成本企業 AI 應用事半功倍

OpenAI 於近日發佈了全新的 AI 模型系列 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano,將透過 API 提供,暫時不會加入到 ChatGPT 聊天機械人平台。這個新系列模型比兩個月之前推出的 GPT-4.5 系列更為精簡,但就有低成本和高效率的優勢,對於企業應用而言更有競爭力。

據 OpenAI 表示,新系列模型在軟件工程能力上取得突破性進展,指令遵循更為精確,且具備處理高達一百萬個 token(相當於約 75 萬字)的超大上下文能力。而 GPT-4.1 的成本更比前代產品降低 26%,而輕量級的 nano 版本則以每百萬 token 僅需 12 美分的價格,成為 OpenAI 最便宜的選擇,為開發者和企業提供了更高效、更經濟的 AI 解決方案。

OpenAI 的產品負責人 Kevin Weil 在週一的發佈會上表示:「GPT-4.1 在幾乎各個方面都優於 GPT-4o,同時提供更低的成本。」新模型系列的核心優勢在於其實用和開發者友好設計。OpenAI 後訓練研究主管 Michelle Pokrass 強調:「GPT-4.1 的訓練只有一個目標:為開發者帶來實用價值。我們發現 GPT-4.1 在遵循企業實際使用的指令方面表現更佳,這使部署生產級應用變得更加容易。」

在軟件工程能力的 SWE-bench Verified 基準測試中,GPT-4.1 得分達 54.6%,比 GPT-4o 提高了 21.4 個百分點。對於開發能獨立處理複雜任務的 AI 代理的企業而言,指令遵循能力的提升尤為寶貴。在 Scale 的 MultiChallenge 基準測試中,GPT-4.1 的得分為 38.3%,超過 GPT-4o 達 10.5 個百分點。

OpenAI 採用三級模型策略直接挑戰 Google 和 Anthropic 等競爭對手。旗艦級 GPT-4.1 針對複雜企業應用,而 mini 和 nano 版本則適用於速度和成本效益為優先事項的場景。同時,OpenAI 宣佈計劃於 7 月 14 日在其 API 中下架兩個月前發佈的最大且最昂貴的模型 GPT-4.5 Preview,將 GPT-4.1 定位為更具成本效益的替代品。

企業應用效果更勝以往

實際測試顯示,GPT-4.1 在企業應用中帶來了實質性改進。湯森路透在使用 GPT-4.1 與其法律 AI 助手 CoCounsel 時,多檔案審查準確性提高了 17%,這對涉及冗長文件的複雜法律工作流程特別有價值。金融公司凱雷(Carlyle)報告稱,從密集文件中提取細粒度財務數據的性能提高了 50%,這對投資分析和決策至關重要。

編碼工具提供商 Windsurf 的 CEO Varun Mohan 分享了詳細性能指標:「我們發現與其他領先模型相比,GPT-4.1 減少了 40% 的不必要文件讀取次數,並減少了 70% 的不必要文件修改。該模型也驚人地不那麼冗長,GPT-4.1 比其他領先模型簡潔 50%。」

所有三款模型都擁有一百萬 token 的上下文窗口,是 GPT-4o 的 128,000 token 限制的八倍。這一擴展容量允許模型一次處理多個冗長檔案或整個代碼庫。OpenAI 演示了 GPT-4.1 分析 1995 年 NASA 長達 450,000 token 的伺服器記錄文件,識別深藏在數據中的異常條目。這一能力對於涉及大型數據集的任務特別有價值。

企業可以利用這些新模型:改進代碼審查和軟件開發流程;增強檔案理解和分析能力;開發更智能的 AI 代理處理複雜任務;提高數據提取和分析的效率;以更低的成本實現 AI 系統的部署。

AI 模型競爭繼續白熱化

GPT-4.1 系列的發佈標誌著企業 AI 的競爭升級。Google 最近推出了具有相當百萬 token 上下文窗口的 Gemini 2.5 Pro,而 Anthropic 的 Claude 3.7 Sonnet 在尋求 OpenAI 替代品的企業中獲得了關注。中國 AI 初創公司 DeepSeek 也最近升級了其模型,為 OpenAI 保持領先地位帶來更多壓力。

OpenAI 今次透過專門 API 而非 ChatGPT 發佈這些模型,顯示了他們的發佈是針對企業和開發者市場為先。之後他們計劃陸續將 GPT-4.1 的功能納入 ChatGPT,但主要焦點仍然是為構建專業應用的企業提供強大工具。

對企業而言,GPT-4.1 系列提供了更實用、更具成本效益的 AI 實施方法。隨著組織繼續將 AI 整合到營運流程,這些在可靠性、具體性和效率方面的改進可能會加速各行業的採用進程。

OpenAI 的策略預視,AI 的未來可能不屬於最大的模型,而是屬於最高效的模型。真正的突破可能不在於基準測試,而在於使更多企業能夠觸及企業級 AI。隨著模型變得更加高效且經濟實惠,我們可能會看到 AI 應用的普及速度超出預期,推動新一波基於 AI 的創新和數碼轉型浪潮。對企業而言,這意味著是時候從試驗性 AI 應用轉向更深入的整合,利用這些更具成本效益的工具創造競爭優勢和業務價值。

來源:OpenAI

Tags : GPT-4.1OpenAI
Antony Shum

The author Antony Shum