AWS re:Invent 2025 : Nova 2 大大降低企業 AI 成本 打破「租用」與「擁有」兩難

AWS 在 re:Invent 2025 大會推出 Nova 2 模型系列、Nova Forge 定制服務及 Nova Act 自動化代理。Nova 2 以領先同級的性價比,挑戰業界頂尖模型,大幅降低企業 AI 成本。特別是 Nova Act 達到 90% 執行可靠性,為金融、醫療等高風險行業的自動化應用,提供清晰可行的商業路徑。

AWS re:Invent 2025 全球大會上,AWS 正式向市場拋出一個顛覆性命題:企業是否還需要為頂級 AI 能力支付天價?隨著 Nova 2 模型系列、Nova Forge 個人化服務,以及 Nova Act 自動化代理的發布,AWS 正試圖用「性價比」重新定義企業 AI 的遊戲規則。

性價比革命 Nova 2 向行業標準發起挑戰

目前已有數萬家企業在使用 Nova 模型。這次推出的 Nova 2 系列,最大殺手鐧就是在保持智能水平的同時,大幅降低使用成本。對於每天需要處理海量客戶查詢、檔案分析或業務流程自動化的企業來說,這意味著相同的預算可以處理更多業務,或者用更少的預算達到相同效果。

Nova 2 Lite 的定位是日常工作負載的經濟型推理模型,能處理文字、圖像和影片輸入並生成文字輸出。最值得關注的是對比測試結果:與 Claude Haiku 4.5 相比,15 項基準測試中有 13 項持平或更優;與 GPT-4o Mini 相比,17 項測試中有 11 項持平或更優;與 Gemini Flash 2.5 相比,18 項測試中有 14 項持平或更優。這種「同級中的領先性價比」,對於需要控制 AI 成本的企業來說是最實際的考量。

更重要的是 Nova 2 Lite 和 Nova 2 Pro 都內置了網頁查找和程式碼執行能力。這意味著模型可以主動搜尋最新的互聯網資訊並直接運行程式碼,確保回答始終基於最新事實,而不僅僅依賴訓練數據。這項能力對於需要處理即時資訊的客戶服務、市場分析或商業決策場景至關重要。

Nova 2 Pro 則針對需要最高準確度的複雜任務而設計。在公開基準測試中,它與 Claude Sonnet 4.5 的 16 項評測中有 10 項持平或更佳;與 GPT-4o 的 16 項評測中有 8 項持平或更佳;與 Gemini 2.5 Pro 的 19 項評測中有 15 項持平或更佳。這款模型特別適合需要精確決策的高風險場景,例如複雜的財務分析、長期戰略規劃,或是需要處理多份檔案進行綜合判斷的業務。

Nova 2 Sonic 和 Omni:突破多模態的邊界

Nova 2 Sonic 是 AWS 的端到端語音模型,將語音與文字的理解與生成深度融合,實現類人對話體驗。這款模型最獨特的能力是異步處理任務:客戶可以在繼續自然對話、甚至切換話題的同時,系統仍在後台完成諸如訂票等操作。這種「邊聊邊做」的能力,對於客戶服務場景來說是革命性的——傳統的語音助理往往需要用戶等待一個任務完成才能繼續,而 Nova 2 Sonic 讓對話變得更自然流暢。

這款模型提供高達 100 萬 tokens 的上下文視窗,能夠支援長時互動,並在語音與文字之間無縫切換。它可以與 Amazon Connect、第三方語音服務供應商(如 Vonage、Twilio、AudioCodes)以及對話式 AI 框架無縫整合。這種開放性讓企業可以將 Nova 2 Sonic 嵌入現有的客戶服務系統中,而不需要大規模重構。

Nova 2 Omni 則是業界首款既可處理多模態輸入(文字、圖像、影片、語音),又能同時生成文字和圖像的統一模型。它可以一次性處理多達 75 萬單詞的文字、數小時音訊、長影片以及數百頁檔案。這種能力的商業價值在於:企業可以同時分析完整產品目錄、用戶評價、品牌規範和影片素材庫,在一個工作流程中即時生成整套營銷活動內容,包括標題、內文、社交媒體帖子以及視覺方案。這不僅降低了連接多種專業模型的成本與複雜度,更大幅縮短了從創意到執行的時間。

▲會場設有 Sports Forum,讓用家親身感受 AWS 的 AI 如何對運動作貢獻,例如這個射籃區,可投過不同角度的鏡頭,分析玩家射球姿勢,然後給予數據幫助玩家改進。

Nova 2 Omni  用戶回應正面

早期用戶對 Nova 2 Omni 的回饋相當正面,特別是其「單一模型解決所有問題」的能力。在實際測試中,這款模型展現出強大的影片分析能力——不僅能總結影片內容,還能回答複雜問題,例如分析目標受眾、檢測內容是否符合規範,甚至可以將製作教學影片的過程分解成以秒為單位的動作步驟時間軸,這對電視製作和教育培訓行業極具價值。更重要的是,它能將圖片、音訊、文字等所有模態的內容整合到統一的嵌入空間中,讓跨模態的比較和查詢變得簡單高效。相比以往需要先讓模型看圖、寫描述、再用描述查詢的繁瑣流程,這種統一處理方式大幅提升了效率。用戶最常提及的優勢是成本:相比之前用於多模態任務的昂貴模型組合,Nova 2 Omni 的價格被認為極具競爭力。

Nova Forge 打破「租用」與「擁有」的兩難

企業在 AI 應用上長期面臨一個兩難局面:使用通用閉源模型,無法深度融合企業專有知識;從零開始自建模型,又需要投入巨大成本與時間。Nova Forge 提供了第三條路徑。

這項服務的創新之處在於「開放式訓練」:AWS 向客戶開放 Nova 預訓練、中期訓練和後期訓練階段的模型檢查點,讓企業可以在訓練各階段將自身數據與 Amazon Nova 精選數據集進行混合。這意味著企業創建的個人化模型(AWS 稱之為「Novellas」)既擁有 Nova 的完整知識與推理能力,又深刻理解企業的業務語境。

Reddit 的技術總監 Chris Slowe 分享了實際成效:「借助 Nova Forge,我們正在構建更統一的內容審核系統,已經取得令人印象深刻的成果。我們用一套更加準確的解決方案替換了過去的多個不同模型,讓審核流程更高效。將多個專業化機器學習工作流程整合為統一方法,是我們在 Reddit 實施和擴展 AI 方式的一次重要轉變。」

除了模型檢查點和數據混合,Nova Forge 還提供三大關鍵能力。首先是個人化強化學習環境,讓企業可以使用自身業務場景建造訓練環境,讓模型在高度貼近真實應用的模擬場景中持續學習。其次是知識蒸餾能力,企業可以利用更大模型生成的示例訓練更小、更高效的模型,在顯著降低成本與延遲的同時,盡可能保留智能水平。第三是負責任 AI 工具套件,協助企業在模型訓練和應用部署中實施安全控制,滿足合規和治理要求。

Booking.com、Cosine AI、Nimbus Therapeutics、野村綜合研究所、OpenBabylon、Reddit 和 Sony 等企業,已經開始利用 Nova Forge 構建專屬模型。這些早期採用者來自不同行業,說明這項服務的應用場景非常廣泛。

▲筆者於 AWS re:invent 2025 會場內,經常都看到 Nova 攤位經常堆滿業界猛人

 

Nova Act:90% 可靠性的自動化代理

AI 代理的概念並不新鮮,但真正能在生產環境中穩定運行的代理卻鳳毛麟角。Nova Act 最大的突破在於:在早期客戶的瀏覽器自動化工作流程中,達到了 90% 的執行可靠性。這個數字至關重要——對於處理金融交易、醫療紀錄或客戶訂單的企業來說,90% 的可靠性意味著系統可以真正投入大規模使用,而不只是實驗室裡的概念驗證。

Nova Act 通過對個人化版 Nova 2 Lite 模型進行強化學習訓練來實現這種可靠性:系統在數以百計的模擬網頁環境上持續運行數千個任務,使模型在基於 UI 的工作流程中表現出眾。這種「在實戰中學習」的訓練方式,讓模型能夠應對真實世界中各種複雜和不可預測的情況。

實際案例最能說明價值。租車巨頭 Hertz 通過使用 Nova Act 實現租車平台端到端測試自動化,將軟件交付速度提升了 5 倍,徹底消除品質保證瓶頸。這個平台每天處理數百萬美元的預訂業務,以往需要數周才能完成的測試流程,如今在數小時內即可完成。這不僅是效率提升,更讓 Hertz 能夠更快速地推出新功能、回應市場變化。

初創公司 Sola Systems 將 Nova Act 整合到其平台中,每月為客戶自動完成數十萬次工作流程任務,涵蓋電子支付對賬、協調貨運和醫療紀錄更新等關鍵業務操作。1Password 利用 Nova Act 協助用戶以更少的手動操作存取登入資訊,只需一個簡單提示即可在數百個不同網站上自動完成登入步驟。

Amazon 自家的衛星互聯網服務 Amazon Leo 在發布前,借助 Nova Act 消除了品質測試瓶頸。團隊用自然語言撰寫測試場景,並自動在數千個 Web 和流動端測試用例中執行和適配,將原本需要數周的人力工作壓縮到數分鐘完成。在初始運行之後,實際測試執行效率提升至 3 倍,同時不產生額外 AI 成本。

開發人員只需幾分鐘就能在零程式碼視覺化環境中,基於自然語言提示快速構建 AI 代理原型;隨後可以在熟悉的整合開發環境(如 VS Code)中對該代理進行疊代強化,並部署到 AWS 生產環境中。這種「快速原型、深度強化、規模部署」的流程,大幅降低了 AI 代理從概念到生產的門檻。

▲ AWS re:invent 2025 現場設有最新發表的 Amazon Leo 展示,原來團隊在發佈前借助了 Nova Act 去消除了品質測試瓶頸,將原本需要數周的人力工作壓縮到數分鐘完成,同時不產生額外 AI 成本。

Cisco、Siemens、Sumo Logic 的選擇

包括 Cisco、Siemens、Sumo Logic 和 Trellix 在內的眾多企業,已經在利用 Nova 2 模型構建各種創新應用,從 AI 代理威脅檢測到影片理解和語音 AI 助理。這些都是技術密集型、對可靠性和性能要求極高的企業,它們的選擇本身就是對 Nova 能力的最好背書。

Cisco 和 Siemens 這樣的工業巨頭選擇 Nova,說明這些模型在處理複雜工業場景和企業級應用時的可靠性已經達到生產標準。Sumo Logic 和 Trellix 專注於安全和威脅檢測,這些領域對準確性的要求極高,任何誤判都可能造成嚴重後果。它們採用 Nova 2 模型構建 AI 代理威脅檢測系統,證明了這些模型在高風險場景下的表現。

 

給企業決策者的啟示

AWS 這次發布傳遞出幾個關鍵訊號。首先 AI 的競爭焦點正在從「誰更強大」轉向「誰更經濟」。當多個模型的性能趨於接近時,性價比將成為決定性因素。Nova 2 系列對標行業頂尖模型的定價策略,正是這一趨勢的體現。

其次個人化能力將決定 AI 能否真正創造業務價值。通用模型固然強大,但只有深度融合企業專有數據和業務邏輯的模型,才能真正解決企業獨特的痛處。Nova Forge 的「開放式訓練」模式,為此提供了一條經濟可行的路徑。

第三,AI 代理正在從概念走向實用。90% 的可靠性是一個分水嶺——這意味著企業可以放心地將關鍵業務流程交給 AI 代理處理。Hertz 的 5 倍速度提升、Sola Systems 的數十萬次月度自動化任務,都是實實在在的商業價值。

最後多模態整合能力將成為下一個競爭高地。Nova 2 Omni 能夠同時處理和生成多種模態內容,這種「一站式」能力大幅降低了系統複雜度和整合成本。對於需要處理多種數據類型的企業來說,這種整合能力的價值遠超單一功能的強化。

AWS 此次發布的核心邏輯很清晰:用性價比優勢降低企業採用門檻,用個人化能力提升業務契合度,用高可靠性確保生產級應用,用多模態整合簡化系統架構。這是一套完整的企業 AI 解決方案,而不僅僅是幾個新模型。對於正在思考 AI 戰略的企業領導者來說,AWS 提供的不是技術選項,而是一條清晰的商業路徑。