LLM Archives - UNWIRE.PRO

AI 實際影響職場遠低於理論預測　Anthropic 研究指部分白領工種面臨結構性轉型

Anthropic 早前發表一份名為「Labor market impacts of AI: A new measure and early evidence」的研究報告，透過結合大型語言模型（LLM）的理論能力評估與 Claude 模型的實際使用數據，建立了一套全新的「觀察曝露度」（observed exposure）指標，用以衡量 AI 對不同職業的實際滲透程度，研究結果顯示 AI 目前對就業市場的實質影響遠低於理論上的自動化潛力，暫時未有證據顯示高曝露職業的失業率出現系統性上升，但年輕白領求職者的入職率已出現初步放緩跡象，反映 AI 對勞動市場的衝擊可能正以一種較隱蔽的方式展開。

閱讀文章

人工智能

OpenAI 下月起停用 GPT-4 系列模型　ChatGPT 用戶須轉用 GPT-5 系列

by Antony Shum on 30 一月, 2026 人工智能 AI 模型 ChatGPT GPT-4o GPT-5 LLM Microsoft AZURE OpenAI 人工智能

OpenAI 本週宣布，將於 2 月 13 日起正式從 ChatGPT 停用 GPT-4o、GPT-4.1、GPT-4.1 mini 及 OpenAI o4-mini 共 4 款人工智能模型。GPT-4o 於 2024 年 5 月推出後，憑藉親切溫暖的對話風格贏得大批忠實用戶，惟 OpenAI 數據顯示目前每日僅有 0.1% 用戶選用該模型，絕大多數用戶已轉投 GPT-5.2，促使公司作出今次退役決定。

閱讀文章

人工智能

楊立昆離開 Meta 創辦 AMI Labs　挑戰大型語言模型主導地位開發世界模型

by Antony Shum on 22 十二月, 2025 人工智能 ai AMILabs DeepLearning FeiFeiLi LLM Meta Nabla startup WorldLabs WorldModels YannLeCun

深度學習先驅 Yann LeCun（楊立昆）在 Meta 工作 12 年後正式宣布離職，並創辦新公司 AMI Labs（Advanced Machine Intelligence Labs），目標是開發「世界模型」（World Models）技術。AMI Labs 計劃籌集 5 億歐元（約港幣 42.4 億元），估值達 30 億歐元（約港幣 254.4 億元）。這間尚未正式營運的初創公司已聘請法國醫療科技公司 Nabla 的創辦人 Alex LeBrun 出任行政總裁，楊立昆本人則擔任執行主席。AMI Labs 計劃於 2026 年初在巴黎設立總部，並與 Nabla 建立策略合作夥伴關係，優先將世界模型技術應用於醫療領域。

閱讀文章

人工智能企業趨勢

小米發佈 MiMo-V2-Flash 大模型強攻 AI 效率戰前 DeepSeek 核心助陣

by anskar on 18 十二月, 2025 人工智能企業趨勢 ai Deepseek LLM MiMo Xiaomi

小米發布自研 AI 大模型 MiMo-V2-Flash，主打高效率推論與 309B 參數架構，並由前 DeepSeek 核心成員羅福莉領軍。憑藉全球 7.4 億用戶及龐大 IoT 生態，小米正試圖透過「人車家」整合策略，在 AI 效率戰中與國際巨頭一較高下。

閱讀文章

人工智能

Gemini 3 信任評分大提升　牛津研究機構獨立測試揭示 AI 模型評估新標準

by Antony Shum on 4 十二月, 2025 人工智能 ai Gemini google HUMAINE LLM Prolific 人工智能基準測試生成式 AI

Google 旗下 Gemini 3 Pro 人工智能模型在由牛津大學研究人員創立的獨立研究機構 Prolific 進行的 HUMAINE 基準測試中取得突破，信任評分由上代 Gemini 2.5 Pro 的 16% 急升至 69%，創下該機構歷來最高分。不同於傳統學術基準測試，HUMAINE 採用 26,000 名真實用戶進行盲測，評估模型在信任度、安全性、適應性及溝通風格等實際應用層面表現。測試結果對企業部署 AI 具重大參考價值，因反映真實用戶體驗而非單純技術指標，助企業按不同用戶群體和應用場景選擇最合適 AI 模型。

閱讀文章

IT 基建人工智能企業趨勢業界消息

阿里通義千問獲 NeurIPS 最佳論文獎　首個中國團隊奪此殊榮

by Pierce on 2 十二月, 2025 IT 基建人工智能企業趨勢業界消息 ai alibaba LLM NeurIPS Qwen

Alibaba 通義千問（Qwen）團隊在 NeurIPS 大會榮獲最佳論文獎，是首個獲此殊榮的中國團隊。研究創新「注意力門控機制」，證實能將大模型訓練成本降低逾 90% 並大幅提升效能。

閱讀文章

人工智能

Red Hat AI 3 解決混合雲部署三大難題　跳出企業 AI 項目 95% 失敗率困局

by anskar on 26 十一月, 2025 人工智能 Agentic AI ai LLM red hat 邊緣運算

面對企業 AI 項目高達 95% 的失敗率，Red Hat 推出 AI 3 平台，透過分散式推理技術 llm-d 及模型即服務（MaaS）架構，解決硬件資源樽頸。配合亞太區主權 AI 趨勢，新平台協助企業將投資轉化為可衡量的業務成果，加速代理式 AI 在混合雲環境實現

閱讀文章

人工智能

LLM 生成惡意程式能力提升　但與全自動網絡攻擊仍有距離

by Antony Shum on 21 十一月, 2025 人工智能 LLM malware security

有網絡安全研究近期發現，大型語言模型（LLM）雖然已經能夠生成惡意程式碼，但目前仍未達到可靠運作水平。Netskope Threat Labs 威脅獵人 Jan Michael Alcantara 在最新研究報告中指出，研究團隊成功誘使 GPT-3.5-Turbo 和 GPT-4 生成惡意軟件，但這些程式碼「對於實際部署而言過於不可靠和無效」。

閱讀文章

人工智能

Hugging Face 警告 LLM 市場現泡沫　專門化細型模型將成企業首選

by Antony Shum on 19 十一月, 2025 人工智能 ai Hugging Face LLM

人工智能平台 Hugging Face 聯合創辦人兼行政總裁 Clem Delangue 日前在 Axios 活動上表示，市場目前面臨的並非廣泛人工智能泡沫，而是過度投資於大型語言模型（LLM）的現象，並預測泡沫或於 2026 年爆破。Clem Delangue 強調大型語言模型只是人工智能其中一個分支，其他領域如生物學、化學、圖像、音訊及影片的人工智能應用仍處於發展初期，未來數年將有更大突破。

閱讀文章

人工智能

英國消費者過度信賴 AI 聊天機械人　研究揭準確率僅約五成

by Antony Shum on 18 十一月, 2025 人工智能 ai ChatGPT LLM UK

英國消費者權益組織 Which? 最新測試顯示，主流 AI 聊天機械人回答消費者查詢時錯誤率極高，但近半使用者仍對這些工具抱有過高信任。研究團隊測試 ChatGPT、Google Gemini、Microsoft Copilot、Meta AI 及 Perplexity 等 6 款工具，發現準確率介乎 50% 至 71%，當中 Meta AI 表現最差，正確率僅約 51%，而全球最多人使用的 ChatGPT 準確率亦只有 64%，排名倒數第二。

閱讀文章