OpenAI 推出 GPT-4.1 系列模型　減低成本企業 AI 應用事半功倍

OpenAI 於近日發佈了全新的 AI 模型系列 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano，將透過 API 提供，暫時不會加入到 ChatGPT 聊天機械人平台。這個新系列模型比兩個月之前推出的 GPT-4.5 系列更為精簡，但就有低成本和高效率的優勢，對於企業應用而言更有競爭力。

據 OpenAI 表示，新系列模型在軟件工程能力上取得突破性進展，指令遵循更為精確，且具備處理高達一百萬個 token（相當於約 75 萬字）的超大上下文能力。而 GPT-4.1 的成本更比前代產品降低 26%，而輕量級的 nano 版本則以每百萬 token 僅需 12 美分的價格，成為 OpenAI 最便宜的選擇，為開發者和企業提供了更高效、更經濟的 AI 解決方案。

OpenAI 的產品負責人 Kevin Weil 在週一的發佈會上表示：「GPT-4.1 在幾乎各個方面都優於 GPT-4o，同時提供更低的成本。」新模型系列的核心優勢在於其實用和開發者友好設計。OpenAI 後訓練研究主管 Michelle Pokrass 強調：「GPT-4.1 的訓練只有一個目標：為開發者帶來實用價值。我們發現 GPT-4.1 在遵循企業實際使用的指令方面表現更佳，這使部署生產級應用變得更加容易。」

在軟件工程能力的 SWE-bench Verified 基準測試中，GPT-4.1 得分達 54.6%，比 GPT-4o 提高了 21.4 個百分點。對於開發能獨立處理複雜任務的 AI 代理的企業而言，指令遵循能力的提升尤為寶貴。在 Scale 的 MultiChallenge 基準測試中，GPT-4.1 的得分為 38.3%，超過 GPT-4o 達 10.5 個百分點。

OpenAI 採用三級模型策略直接挑戰 Google 和 Anthropic 等競爭對手。旗艦級 GPT-4.1 針對複雜企業應用，而 mini 和 nano 版本則適用於速度和成本效益為優先事項的場景。同時，OpenAI 宣佈計劃於 7 月 14 日在其 API 中下架兩個月前發佈的最大且最昂貴的模型 GPT-4.5 Preview，將 GPT-4.1 定位為更具成本效益的替代品。

企業應用效果更勝以往

實際測試顯示，GPT-4.1 在企業應用中帶來了實質性改進。湯森路透在使用 GPT-4.1 與其法律 AI 助手 CoCounsel 時，多檔案審查準確性提高了 17%，這對涉及冗長文件的複雜法律工作流程特別有價值。金融公司凱雷（Carlyle）報告稱，從密集文件中提取細粒度財務數據的性能提高了 50%，這對投資分析和決策至關重要。

編碼工具提供商 Windsurf 的 CEO Varun Mohan 分享了詳細性能指標：「我們發現與其他領先模型相比，GPT-4.1 減少了 40% 的不必要文件讀取次數，並減少了 70% 的不必要文件修改。該模型也驚人地不那麼冗長，GPT-4.1 比其他領先模型簡潔 50%。」

所有三款模型都擁有一百萬 token 的上下文窗口，是 GPT-4o 的 128,000 token 限制的八倍。這一擴展容量允許模型一次處理多個冗長檔案或整個代碼庫。OpenAI 演示了 GPT-4.1 分析 1995 年 NASA 長達 450,000 token 的伺服器記錄文件，識別深藏在數據中的異常條目。這一能力對於涉及大型數據集的任務特別有價值。

企業可以利用這些新模型：改進代碼審查和軟件開發流程；增強檔案理解和分析能力；開發更智能的 AI 代理處理複雜任務；提高數據提取和分析的效率；以更低的成本實現 AI 系統的部署。

AI 模型競爭繼續白熱化

GPT-4.1 系列的發佈標誌著企業 AI 的競爭升級。Google 最近推出了具有相當百萬 token 上下文窗口的 Gemini 2.5 Pro，而 Anthropic 的 Claude 3.7 Sonnet 在尋求 OpenAI 替代品的企業中獲得了關注。中國 AI 初創公司 DeepSeek 也最近升級了其模型，為 OpenAI 保持領先地位帶來更多壓力。

OpenAI 今次透過專門 API 而非 ChatGPT 發佈這些模型，顯示了他們的發佈是針對企業和開發者市場為先。之後他們計劃陸續將 GPT-4.1 的功能納入 ChatGPT，但主要焦點仍然是為構建專業應用的企業提供強大工具。

對企業而言，GPT-4.1 系列提供了更實用、更具成本效益的 AI 實施方法。隨著組織繼續將 AI 整合到營運流程，這些在可靠性、具體性和效率方面的改進可能會加速各行業的採用進程。

OpenAI 的策略預視，AI 的未來可能不屬於最大的模型，而是屬於最高效的模型。真正的突破可能不在於基準測試，而在於使更多企業能夠觸及企業級 AI。隨著模型變得更加高效且經濟實惠，我們可能會看到 AI 應用的普及速度超出預期，推動新一波基於 AI 的創新和數碼轉型浪潮。對企業而言，這意味著是時候從試驗性 AI 應用轉向更深入的整合，利用這些更具成本效益的工具創造競爭優勢和業務價值。

來源：OpenAI

OpenAI 推出 GPT-4.1 系列模型　減低成本企業 AI 應用事半功倍

企業應用效果更勝以往

AI 模型競爭繼續白熱化

專訪：從數碼營銷到北上創業 Vicky 分享香港創業者北上生存與發展心得

智慧社會 (十四) ：學習 GIS 地理資訊提升創意思維

OpenAI 推出 GPT-4.1 系列模型 減低成本企業 AI 應用事半功倍

企業應用效果更勝以往

AI 模型競爭繼續白熱化

you might also like

AWS 數十萬 AI 晶片建設超級集群 助 Anthropic 挑戰 OpenAI

美國參議院通過移除 AI 監管禁令 OpenAI 等 AI 企業遊說失敗

OpenAI 推遲開源模型發佈 同時為 o3 模型大幅降價兼推出高階 o3-pro

OpenAI 年度經常性收入達 100 億美元 ChatGPT 推出不足 3 年翻倍增長

OpenAI 強化企業代理工具競爭力 Responses API 升級劍指 Microsoft 與 Google

OpenAI 推出 GPT-4.1 系列模型　減低成本企業 AI 應用事半功倍

AWS 數十萬 AI 晶片建設超級集群　助 Anthropic 挑戰 OpenAI

美國參議院通過移除 AI 監管禁令　OpenAI 等 AI 企業遊說失敗

OpenAI 推遲開源模型發佈　同時為 o3 模型大幅降價兼推出高階 o3-pro

OpenAI 年度經常性收入達 100 億美元　ChatGPT 推出不足 3 年翻倍增長

OpenAI 強化企業代理工具競爭力　Responses API 升級劍指 Microsoft 與 Google