參考訊息網7月22日報道據美國【華爾街日報】網站7月17日報道,企業正越來越多地部署中小型的生成式人工智能(AI)模型,它們更青睞規模較小、更具成本效益的AI技術,而不是在AI熱潮早期掀起波瀾的大型昂貴模型。
與開放人工智能研究中心的GPT-4(開發成本超過1億美元,使用超過一萬億個參數)等基礎模型不同,更小的模型訓練時使用的數據更少,通常是為特定任務而設計。
幾乎所有的模型提供商都在努力提供更多這類模型,包括微軟和谷歌以及米斯特拉爾人工智能公司、Anthropic公司和科希爾公司等初創企業。
資訊總監們說,對於一些最常見的AI用例(通常涉及文件分類等小範圍、重復的任務)來說,中小型模型更有意義。由於它們使用更少的計算能力,更小模型的執行成本也更低。
這一轉變發生的背景是,企業正慢慢采取行動,部署更多AI用例,它們也面臨著管理這種昂貴技術的成本和回報的壓力。
網絡安全、內容交付和雲端運算公司阿卡邁技術公司的技術長羅拔·布盧莫夫說:「一個在整個萬維網上訓練過的、規模巨大的大型語言模型可能會大材小用。」他說,對於企業用例,「你不需要一個知道【教父】的全部演員名單、知道每一部電影、知道每一部電視劇的AI模型」。
谷歌雲負責全球生成式AI市場的副總裁奧利弗·帕克說,在過去三個月裏,他看到企業開始轉向中型模型,原因之一是這些模型符合捕獲更多企業用例的標準。
非銀行抵押貸款服務商庫珀先生集團的資訊總監斯裏達爾·夏爾馬說,該公司正在它的呼叫中心測試中型模型分析語音數據的能力,以幫助話務員了解對話的可能方向和客戶可能提出的問題。
夏爾馬說:「我們不必僅僅因為某個模型更大,就過度構建它。」他還說,庫珀先生集團也在為更復雜的用例使用大型基礎模型。
到目前為止,道明銀行一直在使用開放人工智能研究中心的GPT系列模型和其他模型,包括使用GPT-4,以幫助呼叫中心的工作人員更快地回答客戶的詢問。但道明銀行首席AI科學家馬克西姆斯·沃爾科夫斯表示,該行最近還與AI模型提供商科希爾公司簽署了一項合作協定,它將審視科希爾公司的中小型模型是否在上述情況和其他用例中更有效、更具成本效益。
沃爾科夫斯說,他將在成本、準確性和延遲方面評估科希爾公司的模型以及開放人工智能研究中心的產品。他預計中型模型將在某些情況下勝出。
他說:「準確性和成本之間的權衡取舍,應該對企業更有利。」
行銷服務公司WPP集團的技術長史帝芬·普雷托留斯說,一年前,企業被少數幾款大型模型吸引。當公司有限度地、試驗性地使用它們的能力時,情況還好,但現在隨著它們的規模擴大,大型模型的成本可能很快就會失控。WPP集團正在使用谷歌Gemini系列的幾款模型,包括中型模型Flash。
Flash適用於分析不同國家的購物習慣,並利用調查結果為給定產品撰寫相關的網頁文案。例如,在英國銷售的睫毛膏的廣告文案突出防水效能,可能會取得最好的效果。普雷托留斯說,撰寫這樣的文案正是中型模型的用武之地。
普雷托留斯說,對於需要大量數據、創造力和解讀的復雜用例,大型模型仍然具有意義和價值。例如,一個大型模型適用於囊括莎士比亞的所有作品,並分析隨時間而發展變化的女性角色和男性角色。但這並不在WPP集團的待辦事項清單上。(編譯/李莎)