Google 近日發布全新 Gemma 3 270M 人工智能模型,這款僅有 2.7 億參數的輕量級模型專為裝置端部署而設計。與動輒擁有 700 億參數或更多的頂尖大型語言模型相比,Gemma 3 270M 體積極小,仍能處理複雜的特定任務,並可在數分鐘內完成微調,滿足企業或獨立開發者需求。
超低耗電運行 手機電量消耗微乎其微
Gemma 3 270M 最突出特點是極高能源效率,Google 內部測試顯示,在 Pixel 9 Pro 系統晶片上運行 INT4 量化版本模型,25 次對話僅消耗裝置 0.75% 電量。這令 Gemma 3 270M 成為裝置端 AI 應用的理想選擇,特別適合重視私隱保護和離線功能的應用場景。
Google DeepMind 員工兼 AI 開發者關係工程師 Omar Sanseviero 在 X 補充,Gemma 3 270M 可直接在用戶瀏覽器中運行,甚至能在 Raspberry Pi 和「多士爐」上運作,凸顯其在極輕量硬件上的運行能力。
架構設計巧妙 詞彙量達 25.6 萬個
Gemma 3 270M 結合 1.7 億嵌入參數和 1 億轉換器區塊參數。憑藉多達 25.6 萬個詞彙的大型詞典,模型能處理罕見和特定詞彙。Google 表示,這種架構支援指令遵循任務的強勁表現,同時保持足夠輕巧,可快速進行微調並部署在資源有限裝置上。
模型承襲較大型 Gemma 3 模型的架構和預先訓練技術,確保在 Gemma 生態系統內的兼容性。配合 Hugging Face、UnSloth 和 JAX 等工具的說明文件、微調配方和部署指南,開發者可快速從實驗階段轉入部署階段。
基準測試表現亮眼 但仍有競爭對手領先
在測量模型指令遵循能力的 IFEval 基準測試中,指令調校版 Gemma 3 270M 得分 51.2%。這個成績遠超同等規模模型如 SmolLM2 135M Instruct 和 Qwen 2.5 0.5B Instruct,並接近部分十億參數模型的表現範圍。
然而競爭對手 Liquid AI 研究人員和高層在 X 回應指出,Google 沒有把他們今年 7 月發布的 LFM2-350M 模型計算在內,後者在相同測試中得分高達 65.12%,參數數量僅略多於 Gemma 3 270M。
專精特定任務 成本效益顯著
Google 將 Gemma 3 270M 定位為「選擇合適工具完成工作」理念的體現,而非單純依賴模型規模。對於情感分析、實體提取、查詢路由、結構化文本生成、合規檢查和創意寫作等功能,公司表示經微調的小型模型可提供比大型通用模型更快速、更具成本效益的結果。
專業化優勢在過往合作中已獲驗證,例如 Adaptive ML 與 SK Telecom 合作項目。透過對 Gemma 3 4B 模型進行多語言內容審核微調,團隊表現超越規模更大的專有系統。Gemma 3 270M 期望能實現更小規模的類似成功,支援針對個別任務定制的專業模型組合。
床邊故事生成器展示創意潜力
除企業應用外,該模型亦適合創意場景。Google 在 YouTube 展示影片中推出使用 Gemma 3 270M 和 Transformers.js 構建的床邊故事生成器應用,完全在瀏覽器離線運行,展示模型在輕量級、易於存取應用中的多功能性。
影片重點展示模型整合多重輸入的能力,允許用戶選擇主角(如「神奇貓咪」)、背景(「魔法森林」)、情節轉折(「發現秘密門」)、主題(「冒險」)和所需長度(「短篇」)。設定參數後,Gemma 3 270M 模型生成連貫且富想像力的故事,展示其創意、情境感知文本生成能力。
開源許可 商業應用無障礙
Gemma 3 270M 根據 Gemma 使用條款發布,允許使用、複製、修改和分發模型及衍生作品,惟須滿足特定條件。這些條件包括延續 Google 禁用政策概述的使用限制、向下游接收者提供使用條款,以及清楚標示任何修改。分發可直接進行或透過託管服務如 API 或網絡應用程式進行。
對企業團隊和商業開發者而言,這意味模型可嵌入產品、作為雲端服務部分部署或微調成專業衍生產品,只要遵守許可條款。Google 不對模型生成內容主張權利,讓企業完全擁有所創造內容的權利。
隨著 Gemmaverse 下載量超過 2 億次,以及 Gemma 產品線涵蓋雲端、桌面和流動裝置版本,Google AI 開發者將 Gemma 3 270M 定位為構建快速、具成本效益和注重私隱 AI 解決方案的基礎。