當前位置: 華文世界 > 科技

一體機是大模型行業側落地的重要「棋子」麽?丨ToB產業觀察

2024-10-19科技

2024年,大模型的產業落地開始顯著提速。據統計,2024年上半年,大模型可統計到的中標金額約 9.38億元,已經遠超2023年全年大模型中標專案披露金額(7.89億元)。

如果說2023年是大模型元年的話,那麽2024年就是大模型在行業側套用爆發之年。

大模型從「大」到「專」

今年以來,隨著大模型技術的不斷完善,能力不斷增強,大模型也受到了ToB行業的關註,大模型的能力在越來越多的行業場景中套用落地。

對於大多數產業以及企業主體來說,如何實作AI賦能現有的技術、業務,是最現實的命題,也是企業是否能在新一輪技術周期中保持活力的要素之一。在浪潮資訊 產品方案開發部總經理魏健看來,要實作大模型的廣泛落地與深入行業套用,沒有大模型不行,但只有大模型也不行,「大模型在行業側落地的關鍵在於如何有效提高AI套用創新的質素和效率。」魏健強調。

目前大模型在行業側套用過程中仍存在諸多挑戰。首先,硬件層面,大模型的訓練過程需要龐大的硬件算力資源支撐,隨著模型參數規模的持續擴張,對算力的要求也越來越高。這不僅增加了成本,也對硬件器材的效能提出了更高要求。包括GPU在內的諸多大模型訓練、推理的硬件器材價格昂貴,又因大模型在行業的套用仍處於初期階段,效果還不可量化,在企業都註重ROI(投資回報率)的大背景下,對於硬件器材的采購成為行業套用大模型的第一道坎,對此,青雲副總裁沈鷗告訴鈦媒體APP,很多企業出於ROI的考慮,不願意在一開始不知道效果的情況就投入大量的財力和人力,「企業大多選擇小投入的方式先‘試水’,這就需要業務部署的速度快,見效快。」沈鷗如是說。

魏健也有著相似的看法,她告訴鈦媒體APP,要實作大模型與行業場景的深度結合,實作高效、高可靠、高質素的模型套用效果,涉及復雜的開發環節,技術門檻高且開發周期長,而且更難以回避的問題是: 在大模型爆火的當下,搭建AI開發和實施團隊的成本變得極高。

其次,從現階段套用上看,企業在使用模型賦能業務的過程中,選擇參數量小的模型效果要好於大參數量的模型,「巨大參數量級的通用大模型,很難直接用於復雜、離散的行業場景,各行業知識專業化程度高,可遷移性低,通用大模型本身難以覆蓋,所以經常出現大模型「幻覺」或是「胡言亂語」的問題,這是企業大模型無法承受之重,因此必須結合行業專業數據進行再學習。」魏健告訴鈦媒體APP。

除此之外,企業使用者在大模型開發和套用的過程中還面臨著,在部署本地化、私有化大模型時,部署經驗不足、效能最佳化瓶頸、算力資源利用不合理等挑戰,難以在保障數據與業務私密的條件下構建和使用本地化大模型套用。

面對這些挑戰,企業在大模型套用初期更需要一套一站式的解決方案來部署大模型,透過軟硬件協同的一體化設計,具備快速交付、開箱即用、極致效能、安全高效的大模型開發的能力的一體機就成為當下企業在部署行業模型過程中的極佳選擇之一。

一體機成為行業大模型落地新寵

公開數據顯示,在2023年和2024年上半年,大模型專案中硬件、軟件和服務的占比分別為:硬件占比60%和61%,軟件占比11%和5%,服務占比17%和30%以上。這一數據表明,在大模型專案中,硬件和服務占據了主要地位。

魏健告訴鈦媒體APP,從一些數據中可以看出,硬件和服務目前是大模型專案中投入最大的部份,而對於一些傳統行業企業來說,如何能快速的讓大模型落地,已經成為了當下最關鍵的一個問題,而一體機是一個很好的選擇。

無獨有偶,青雲科技CEO林源也對鈦媒體APP表示,當行業面臨一項新技術的時候,大家會更傾向於軟硬一體的解決方案,就好像在企業數碼化轉型之初,大家不惜重金購買IBM的大型電腦,而隨著技術的發展,當一項技術變得更「通用」的時候,就形成了標準化的產品。才出現了當下的伺服器廠商、軟件廠商、數據庫廠商等等細分化的廠商。「這點在大模型時代亦是如此,當企業對於大模型在行業的套用好處於較初級的階段時,一體機是一個能讓企業快速落地大模型套用的好方式。」林源指出。

目前市面上常見的一體機產品主要面向的場景是:端側的微調和推理的場景。從技術發展的規律上不難看出——每一輪技術的變革,技術的使用門檻、開發門檻都在降低,對此,林源告訴鈦媒體APP,這也就意味著使用者群體更多,需求也會變多,也就會消耗更大的算力,「AI 變革也需要多樣的互動模式,一體機是必不可少的一種。服務商可能也有會不同的側重點,青雲更聚焦軟件與套用層面,比如針對醫療行業搭載幫助場景落地的套用。」林源強調。

從使用者群體角度出發,魏健告訴鈦媒體APP,根據浪潮資訊對客戶的觀察發現,浪潮資訊釋出的元腦企智一體機主要的客戶可以分為三類,一類是傳統行業的使用者,「諸如制造業使用者,他們有一定的數據和人才的積累,透過一體機可以以較低的成本,快速的實作模型套用開發。」魏健指出。

第二類是ISV(獨立軟件開發商)公司,隨著大模型套用的爆發,傳統的ISV公司也從原先的觀望狀態,逐漸開始布局大模型相關產品,而這個過程中,對於大模型軟件開發而言,一體機的出現也能讓這些公司以更低的成本,更快的速度開發出具備大模型能力的軟件,從而快速的搶占市場份額。

第三類則是大模型套用開發團隊,以智譜華章為代表,一體機加上這些企業本身的產品化能力,軟件硬件的產品化能力、工程化能力,以及是面向企業客戶的服務能力、交付能力,形成互補,從而能幫助這些初入大模型行業的新晉玩家快速發展。

「除此之外,還有很多SI整合商也是訓推一體機的受眾,」魏健指出,「客戶需要對大模型專門的調優能力,而市場上能提供這類服務的企業少之又少。」

另一方面,從場景的角度出發,在林源看來, 當下一體機更適合於一些標準化的小場景 ,「對於復雜業務場景的使用者而言,客製化肯定還是最好的選擇,但是對於一些標準化的小場景來說,一體機提供的標準化的服務能讓他們更快、更便宜的開發出自身需要的專有小模型產品。」林源告訴鈦媒體APP。

雲廠商、硬件廠商,紛紛入局

當下,一體機已經成為企業完成大模型套用開發,落地行業大模型套用過程中重要的一環,據鈦媒體了解,目前市面上已經有包括硬件器材廠商、雲廠商等在內的20余家企業布局一體機產品,業內期望透過軟硬一體的產品解決方案,填平大模型套用現狀與預期之間存在鴻溝,彌補生態培育的時間差,加速企業套用步伐。

硬件廠商方面,以浪潮資訊為例,在前不久浪潮資訊就剛剛推出了元腦企智EPAI一體機,該一體機融合了元腦企智EPAI企業大模型開發平台和元腦伺服器。元腦企智EPAI一體機透過軟硬件一體化設計,提供一站式大模型生產及套用全流程開發工具鏈,同時支持嵌入各夥伴在大模型訓練、微調和最佳化方面的演算法和模型能力,共同設計、聯合開發、協同上市、持續叠代,共同為終端客戶提供更全面的AI原生套用開發「超級工作台」。

魏健向鈦媒體APP介紹,此次推出的一體機產品共包含基礎版、標準版、高級版、創新版和集群版五個版本,主要面向制造、金融等行業客戶、ISV合作夥伴以及大模型套用開發團隊三類使用者提供一站式大模型生產及套用全流程開發工具鏈,「使用者可以根據自身需求,選擇不同版本的產品,‘豐儉由人’。」魏健如是說。

聯想也於近期釋出了全新的智能體一體機產品,在硬件方面,智能體一體機基於聯想ThinkStation PX旗艦工作站打造,采用桌面級安裝部署,避免了伺服器需要專門機房運維的復雜性,大大簡化了維護管理的工作量,極大地方便了運維操作。軟件層面,聯想智能體一體機配備了「聯想智能體平台」,整合多種開源大模型、智能體樣例及開發評估工具,並提供零程式碼開發功能,支持使用者在短時間內以低門檻的方式建立智能體。

除了浪潮資訊、聯想這些在伺服器領域的領軍者之外,其他諸如中興通訊 、趨境科技等企業也都紛紛入局,部署大模型訓推一體機。

另一方面,雲廠商們也在今年紛紛加入到了一體機的市場中。以青雲科技為例,青雲科技基於早先結束的雲易捷一體機,推出了AI智算一體機,也是為使用者提供了一個開箱即用的AI環境,幫助使用者快速構建、訓練和部署AI模型。

優刻得也推出了大模型一體機產品,該一體機基於一雲多芯且自主可控的UCloudStack全棧私有雲平台,提供虛擬化、儲存、網絡及MaaS模型的私有化一體交付方案,支持Alpaca-LoRA、ChatGLM、T5、MiniGPT-4、Stable Diffusion、LLaMA2及Milvus向量數據庫等開源模型的部署及算力排程,使用者可在本地或自有數據中心內,輕松部署針對特定場景的大模型服務。

與硬件廠商的一體機不同的是,雲廠商推出的一體機主要將能力重心放在本就擅長的軟件和雲平台層面,沈鷗告訴鈦媒體APP,在硬件層面,青雲科技還是透過ODM(原始設計制造商),而將更多的精力放在雲廠商本身擅長的領域——軟件和平台。

無論是硬件廠商推出的一體機,還是軟件廠商推出的一體機,除了各自的側重點略有不同以外,其核心的能力還是相對一致的。

魏健和林源都曾向鈦媒體APP表示, 作為一體機產品,首先要具備的就是開箱即用的能力 ,「這個開箱即用的能力並不是說像手機那樣直接讓終端使用者使用,而是面向ISV和套用開發者的開箱即用。」林源告訴鈦媒體APP。

其次,無論是浪潮資訊推出的元腦企智EPAI一體機,還是青雲科技推出的AI智算一體機,都為使用者提供了一個開源開放的大模型平台,使用者透過使用一體機可以對接到國內絕大多數主流的開源大模型,並任意呼叫這些大模型的能力來實作企業級模型軟件和產品的開發,並且也都可以透過OTA等方式實作模型的叠代。 (本文正選於鈦媒體APP,作者|張申宇,編輯丨蓋虹達)