當前位置: 華文世界 > 科技

大模型套用:很近,亦很遠

2024-09-03科技
【寫在前面】得益於AI大模型套用,今年每次需要寫方案時我少了很多恐懼心理,在過去若幹年的從業經歷中,我並沒有寫過多少方案。但現在沒關系,即便沒有任何頭緒,也可以先把需求丟給AI,讓它寫一版出來看看,一家套用寫出來的不滿意還可以再多換兩家試一試,畢竟切換只是開啟一個網站或APP的事。
但我工作更重要的內容是寫稿件,這點AI暫時還沒辦法幫我解決,譬如將采訪錄音整理成一篇稿件,即便是像寫方案那樣,只是出一版看上去算合理的框架。因此,如果現在讓我為AI大模型套用付費,很難。
或許是因為有很多像我這樣的消費者,大模型套用現階段要想從C端(消費端)直接賺到錢是極其困難的事,為B端(企業端)客戶部署私有模型的需求成為很多大模型公司目前獲取收入的重要路徑(有一些大型企業出於安全等方面因素的考慮,相對於直接呼叫大模型公司的API介面,他們願意投入部署私有模型),但鑒於底座模型仍然存在幻覺等缺陷,以及投入規模大、場景難以深入、尚不能真正賦能企業主流業務、缺乏訓練模型所需的數據等問題也使得這些企業在部署私有模型時也進退維艱。
技術叠代的列車正在滾滾向前,誰也不願意錯過,但是誰能真正抵達終點,還需要經歷漫長的考驗。大模型套用來了,很近,近在身邊,但它成為一門好的生意,路還很遠。
焦慮正在蔓延
今年6月,創新工場聯合CEO汪華在AGI Playground 2024上一場廣受好評的演講中說到,有很多同學和他交流,有焦慮感,覺得在算力上花了這麽多錢,成就的只有輝達,套用沒有爆發,到底什麽時候套用能爆發,將來套用到底能不能爆發?汪華覺得大家還是太焦慮了。
這種焦慮感是現實存在的,如果說去年大家都還在追趕ChatGPT,鍛造大模型,進入2024後,大家關註的焦點開始從底座模型向AI套用側轉移,無論是ToB還是ToC,AI套用正在大面積普及。向套用轉移的本質是大家開始考慮如何實作大模型的商業化,完成賺錢這件事。而現狀是,很少有公司能夠依賴大模型賺到錢。
最重要的原因之一是大模型投入太貴了。訓練成本、推理成本、人力成本是鍛造一個大模型繞不過去的硬性成本。據悉,OpenAI在今年年中年化收入超過34億美元,但預計年底將有50億美元的虧損,在AI模型訓練和人員配備上花了85億美元。
「大模型企業訓練基礎模型的算力投入基本都是億元級別的,他們很難將這部份成本透過目前的ToB計畫來分攤,所以只能透過不斷融資不斷投入,但是隨著估值越來越高,融資只會越來越困難,到最後大家必須要有一個能夠實作規模化收入的商業模式。」雲啟資本合夥人陳昱說。
然而,訓練大模型的算力等成本投入超過了以往任何一項技術,私有化部署大模型硬體加上軟體至少上千萬元,一般企業很難承擔。
這樣的大規模投入對於尚未實作正向回血的創業企業來說無異於一次大冒險。
對於很多早期已經從事人工智慧領域的企業來說,投入還是不投入大模型,不是一道選擇題而是一道必答題。
2015年成立的達觀數據有限公司便是其中之一,該公司是一家為企業提供各類場景智慧文本機器人的國家高新技術企業,大模型技術的出現對於該公司原先用於智慧文本辨識業務的NLP(自然語言處理)是一次重要的考驗,只有抓住大模型的技術發展浪潮快速進行技術叠代,才能持續獲得原有市場。
達觀數據有限公司首席戰略官劉江賢說,「大模型新技術帶來的問題是雖然效果可能更好,但需要投入更大的訓練資金。原先客戶可以承擔POC(概念驗證)的費用,但現在很難,這不是普通的產品,它需要不斷叠代,並且要和行業套用相結合,這是一個巨大的挑戰。」
數據和場景是困難的核心
海通證券2023年初開始布局大模型建設,目前與商湯合作,以商湯的日日新大模型為基座,構建證券垂直領域的大模型。經過近一年時間的摸索,海通證券和商湯聯合研制的大模型已經在企業內部啟動了多元套用。譬如套用大模型能力建立了投顧知識庫,打造研報資訊核心觀點生成等場景;數位員工實作了多模態互動能力,可以理解復雜的語言指令,透過語音辨識和自然語言處理技術,實作與使用者的無縫對話。
但還有更多AI功能的實作需要攻克難關,譬如透過利用大模型技術來替代原先的內部搜尋引擎,最終不僅可以實作更多的智慧功能,還能達到降本增效的目標,但現在的最大的問題是在數據上,「算力畢竟可以用資金解決,但除了算力,還需要高品質的語料數據,需要收集、清洗、標記、最後才能給到大模型訓練。」海通證券相關負責人介紹說。行業語料不能實作共享也是目前作垂類大模型存在的一個最大的問題。據報道,目前已經有至少17家券商在大模型領域有所探索,大家用的基座模型能力其實差別不大,各自在部署私有模型裏最終會被局限於各自擁有的數據。
此外,落地的套用場景也是企業大模型研發人員的一大挑戰。最初企業員工可能會因為好奇來使用AI,但如果不能真正賦能到主營業務中,使用頻率會持續下降。賦能企業業務發展,並且讓AI套用簡單易用,是海通證券大模型研發團隊要解決的核心問題。
科大訊飛星火軍團政企業務的相關負責人在一場媒體交流會上表示,數據和場景同樣是他們在為央國企等B端客戶服務的過程中遇到的挑戰。「對於大模型技術的發展來說,資金大家可以透過各種方式去解決,但更核心的其實是行業數據,以及套用場景,以及在場景下的叠代。」
「有的企業成立的時間有好幾十年,組織龐大,數據標準不統一,從自動化到數位化、資訊化直到現在的智慧化,每個企業的進展都不一樣,如果是數位化水平較高的企業那麽在使用大模型過程中,數據可能問題就不大;但有的企業連自動化都還沒有完成,數據還是紙質的,那麽智慧化就很難推進。」該負責人表示。
上述科大訊飛相關負責人表示,每個行業都有細分場景,對於大模型的服務商來說,必須篩選出適合大模型去介入的場景,和甲方一起完成共贏共創。「從0到1 的事情總得有人去做,只有用上了大模型才能知道大模型在這個地方是否能夠落地。以我們做的人工智慧賦能招投標為例,雖然投入成本很高,但我們還是咬著牙堅持在幹這件事,這算是一個重要的戰略選擇。我們還是希望可以和各個龍頭企業去深耕細作,真正去解決場景的問題,做到有效果、可量化、可推廣,這是一個長期過程。」
不過對於使用大模型的企業來說,開放場景不是一個容易的選擇。由於當前的技術尚未成熟,難以達到精準,一旦出現錯誤帶來的責任將由誰來承擔,成為一項難題。在金融科技圈裏,大家有句玩笑話,「AI可以代替人工作,但不能代替人坐牢。」雖然大模型套用理論上可以在多個領域裏發揮作用,但目前它仍然只能在非核心業務範圍內試錯。
給技術多一點時間
對於科大訊飛的星火軍團政企業務來說,他們最終的目的是在與合作夥伴深入行業之後,將從中提升的通用能力再運用到各行各業,「我們看來,目前B端市場仍然是大模型落地最快,也是最能有效驗證大模型技術的一個主要市場。」
雖然挑戰很大,但在達觀數據董事長陳運文看來,在這樣一個技術變革的關口,同樣充滿了機遇,只不過需要時間來給技術一些成長的空間。「當一個新技術在行業內尚未被大規模套用時,會出現很多質疑和觀望,大模型目前才不過一兩年的時間,產品化仍需要經歷一個打磨、成熟的過程,就大模型來說,現在要解決的更多是落地過程中和套用場景結合的工程問題。」
在陳運文看來,這個成熟的過程可能比我們想象的更快,「20年前,我讀博期間,學術界普遍認為認知智慧技術的成熟至少需要三五十年的時間才能實作突破,但現在大模型對此的突破和發展遠超了當時的想象,並且還在加速發展,成果越來越多,當前大模型所存在的幻覺、精準度等問題,我認為在未來透過技術叠代都可以克服。」
陳運文將目前的大模型比喻成汽車的發動機,「它具備非常強勁的能力,但是只有一個發動機是很難實用的,還需要配套開發大量的功能模組,裝配成一輛‘整車’才能變成各行業裏真正可用的系統。」
另有大模型企業人士表示,當下大模型技術是套用落地困難的重要原因,但只要給大模型更多的套用場景,底座大模型的能力就能根據使用者反饋得以不斷提高,形成大模型叠代套用的正迴圈,最終實作智慧時代的到來。
對此,汪華的公開發言表達了差不多的觀點,他說,大模型從開始到現在才一年多時間,套用發展本質上還是要隨著模型的成熟和整個套用生態的構建逐漸發展。「2010年時跟大家說將來所有的套用,吃喝玩樂、看視訊、購物等都可以在手機上完成,但是TikTok出現的時候,已經是五六年之後的事情了。」
AI套用本身正確的互動形態到底是什麽,需要給開發者和套用者一點時間。在汪華看來,這個時間會比當年行動網際網路更快,可能是兩三年時間。「模型成本的下降是一件工程的事情,也是一件確定的事情」,汪華判斷,到今年年底、明年年初,百萬token會降到幾塊錢人民幣,到明年年底,數位還會再降一個數量級。
陳運文也認為,伴隨著技術的快速叠代,鍛造大模型的使用成本會極速下降。「100年前,當汽車剛被發明時,不僅營運成本遠高於馬車,並且維護也很麻煩,每行駛兩公裏就要保養一次,人們普遍認為汽車不如馬車方便。然而隨著汽車技術的不斷改進,汽車只用了10年就實作了對馬車的全面替代。」就大模型而言,當下能夠看到客戶提出了許多的需求,這本身就是一件很值得期待的事情。
澎湃新聞記者 宦艷紅
(本文來自澎湃新聞,更多原創資訊請下載「澎湃新聞」APP)