自 ChatGPT 問世以來,各行各業都在躍躍欲試開發或應用生成式 AI。公眾對 AI 寄予厚望,但由於其高昂的成本和技術的複雜性,究竟如何讓 AI 發揮作用,是時下大眾關注的焦點。
AI 憑藉強大的性能和一致性,能夠發現人類可能會錯過或者忽視的東西,因此具有強大潛力。但歸根結底,研發 AI 的基礎是數據。
也就是說,恰當地處理和保護數據至關重要。數據不僅是整個 IT 基礎設施的命脈,也是所有創新的基礎。作為生成式 AI 基礎設施的一部分,數據庫在不斷發展以適應生成式 AI 時代企業的需求。AI 的有效性取決於企業如何選擇恰當的數據庫來管理數據。
常用數據庫模型
在線交易處理(Online Transaction Processing,OLTP)數據庫是一種支持實施事務處理的數據庫系統架構,令企業能夠處理大量用戶同時進行的並發交易,例如在網上銀行交易、線上購物等。
此外,在線分析處理(On-Line Analytical Processing,OLAP)技術能夠整合交易數據,更能幫助整合多個來源的數據,因此可從多維度對數據進行快速而深入的交互式分析。此技術極大地提高了企業的分析效率。舉例來說,零售商可以將其庫存數據與客戶購買行為數據結合起來,依此判斷是否需要增加某種特定商品的生產量。
AI 時代的新興數據庫模型
隨著 AI 時代的到來,我們預計向量數據庫模型將最具變革性。
向量數據庫是用於配合大語言模型,通過將非結構化數據轉化為高維向量,為「智能工作負載」提供所需的數據高效管理。預計到 2050 年,包括文件、圖像、音頻錄製、影片等在內的非結構化數據,將佔據全球數據的 80%。彼時,AI 預計將實現更高階的語義理解,即理解潛在的語境和語義的細微差別,而非單純的字面含義。
AI 的終極目標是要理解和利用數據,而向量數據庫是提升大型語言模型行業特定知識的一個關鍵要素。例如,網絡遊戲公司可透過使用向量數據庫解決方案,創建能夠與人類玩家互動的智能非玩家角色(NPC)。這些 NPC 不只是按照預設腳本對話,而是會根據對玩家交流內容的實時理解做出反應,令互動更加真實。
兼顧成本與效益
當然,AI 的潛力不僅限於遊戲應用,甚至不止於理解和處理非結構化數據。
AI 還可被用於管理數據庫。當存儲空間不足時,AI 可以向系統管理員發出警報,提醒關注存儲需求並詢問是否需要擴展存儲空間。若獲得授權,AI 還能自動擴展存儲空間。同樣的功能也可應用於 CPU 容量、存儲容量以及其他功能上。
過去購買雲端服務產品時,必須預設一組伺服器資源,但這將帶來一定的成本。當預設的伺服器容量超過實際工作負載所需的量時,就會造成伺服器資源的浪費。
無伺服器運算旨在解決這一挑戰,確保雲服務所使用的伺服器容量精確地匹配工作負載的需求,並且能隨著工作負載動態變化進行適應。
透過將 AI 與無伺服器雲運算相結合,可實現兩者優勢的完美結合。AI 能夠增強企業決策能力,以應對突發的高增需求或動態變化的工作負載。企業亦只需按實際所需的資源數量付費,降低使用成本。
企業是否能夠把握住當下的 AI 趨勢,在競爭中脫穎而出,關鍵在於如何有效地利用適當的數據庫,以充分發揮 AI 的潛力和優勢。
撰文:阿里雲數據庫產品事業部總裁李飛飛博士