close
人工智能企業趨勢

OpenAI 緊急發布 ChatGPT 5.2 七成表現超越人類專家反擊 Gemini 3

OpenAI 於 2025 年 12 月 11 日正式推出 GPT-5.2,是該公司回應 Google Gemini 3 的反擊之作,亦是繼內部「Code Red」備忘錄後最快速的產品更新。這款定位為「專業知識工作最強模型」的 AI 系統,在 44 個不同職業實測中,有 70.9% 時間表現超越業內專家,相比前代 GPT-5.1 的 38.8% 有顯著躍升。GPT-5.2 分為三個版本:針對日常查詢優化速度的 Instant、擅長複雜程式碼和長文檔分析的 Thinking,以及追求極致準確性的 Pro 版本,即日起向 ChatGPT 付費使用及 API 開發者開放。

AI 軍備競賽白熱化:OpenAI 的生存之戰

2025 年 12 月初,OpenAI 行政總裁 Sam Altman 向全體員工發出罕見「Code Red」緊急指令,要求所有團隊暫停手頭工作,將資源全數投入改善 ChatGPT 質素。這次危機源於 Google Gemini 3 在 11 月發布後,於多項第三方效能排名中奪下領先地位,甚至連 Anthropic 的 Claude Opus 4.5 也在關鍵基準測試 SWE-Bench Verified 取得 80.9% 優異成績,超越 GPT-5.1 的 76.3%。據《華爾街日報》報道,原定 12 月下旬發布的 GPT-5.2 被提前至少三週推出,所有廣告計劃、AI 購物功能和健康代理項目全部暫停。VentureBeat 分析師指出,這標誌著 OpenAI 自 2022 年 ChatGPT 推出以來首次面臨真正市場壓力,過去三個月有數十位核心研究人員離職加入前 CTO Mira Murati 創辦的 Thinking Machines 及 Meta 的 Superintelligence Labs。

技術突破與效能對決

GPT-5.2 配備 40 萬個 token 上下文窗口,可同時處理數百份文件或大型程式碼庫,並支援最高 12.8 萬個 token 輸出長度,足以一次性生成完整報告或應用程式。知識截止日期更新至 2025 年 8 月,並整合「推理 token 支援」,採用類似 o1 系列的思維鏈處理架構。在 GPQA Diamond 研究生級科學基準測試中,GPT-5.2 Pro 達到 93.2%,幾乎追平 Gemini 3 Deep Think 的 93.8%。TechCrunch 實測顯示,GPT-5.2 在多步驟專案管理中表現出色,例如處理「預訂航班、安排紐約過夜住宿、申請醫療座位需求」等連續任務時,完成度較 GPT-5.1 更全面。然而 Google 在多模態能力方面仍保持優勢,Gemini 3 Pro 在 MMMU-Pro 多模態推理測試中取得 81.0%,高於 GPT-5.1 的 76.0%。

企業應用與市場定價策略

OpenAI 將 GPT-5.2 定價為每百萬輸入 token 收費 1.75 美元(約港幣 13.7 元),輸出 token 收費 14 美元(約港幣 109.2 元),快取輸入可享 90% 折扣。Microsoft 香港指超過 80% 香港企業客戶正積極探索 AI 解決方案,並強調組織應將 AI 視為「副駕駛」以提升生產力。Databricks 已宣布透過 Agent Bricks 平台支援 GPT-5.2,讓開發者能安全連接管理數據、使用 MCP 工具並評估每個回應準確性。Lunabase.ai 企業指南指出,GPT-5.2 的編碼代理能力提升 27%,API 回應時間縮短,並將「過度拒絕」(AI 不當拒絕無害請求)情況減少 40%。Every.to 分析師評價這次升級為「漸進式改進」,但強調 70.9% 專家超越率已足以重新定義知識工作的生產力基準。

產業格局重塑與未來競爭

這場「Code Red」事件象徵 AI 產業競爭態勢反轉——三年前 Google 因 ChatGPT 而陷入恐慌,如今 OpenAI 卻因 Gemini 3 感受到生存威脅。Dev.to 技術比較報告顯示,雖然 GPT-5.2 在推理和編碼速度上取得進展,但 Google 透過深度整合搜尋引擎和 AI Studio,在實時互動體驗方面建立護城河。OpenAI 行政總裁 Altman 在 X 平台上坦承:「即使沒有輸出精美文件等新功能,GPT-5.2 仍像是我們很長一段時間以來最大升級」。分析師預測 2025 年 AI 模型發展將呈現三大趨勢:上下文窗口擴展至百萬級成為標準、適應性推理機制普及,以及針對編碼、推理或創意的專業化模型湧現。企業領袖需思考的核心問題是:當 AI 在七成時間超越人類專家時,組織的人才戰略和工作流程該如何重新設計?

資料來源:OpenAITechCrunchVenturesBeatFortuneBusiness Insider

Tags : GeminigoogleGPT-5.2OpenAI生成式AI