當前位置: 華文世界 > 科技

「百模大戰」中 工業大模型如何闖出新天地?

2024-07-16科技
提問「外感風寒推薦哪些方劑」,系統在幾秒鐘內就能列出麻黃湯、桂枝湯等方劑與具體成分;提問「身體濕氣重有哪些危害」,系統也能快速給出全面解答、提出飲食調理等治療方法……走進天津天開高教科創園5號樓,天大智圖(天津)科技有限公司的工作人員正忙碌地對「海河·岐伯」中醫藥大模型展開內測。公司研發總監徐大為說,在人工智慧輔助下,大模型能為臨床醫生提供內容更廣泛、更全面的輔助診療建議,進一步提高中醫診療效率。
提出問題,迅速獲得專業回答;輸入需求,線上進行服裝設計;提供圖紙,自動完成冰箱組裝……近期在天津舉辦的2024世界智慧產業博覽會上,一批聚焦工業、制造業套用的垂直領域大模型成為與會人士關註的焦點。
推動大模型更加深入賦能工業制造業,是人工智慧行業發展的重要方向。但由於供需不匹配、數據難獲得、算力水平低等問題,工業大模型當前的發展速度和規模仍受制約。面對人工智慧「百模大戰」風起雲湧的現實環境,工業大模型如何聚焦細分領域、加速創新破局?
工業大模型發展如火如荼
隨著新一代人工智慧技術的發展,基於大模型的生成式人工智慧以學習能力強、處理速度快、服務個人化等優勢,成為智慧科技領域的「寵兒」,尤為吸睛。
作為海爾卡奧斯工業互聯網平台在人工智慧領域的前沿科技成果,卡奧斯工業大模型COSMO-GPT亮相2024世界智慧產業博覽會。在產品釋出環節,卡奧斯工業智慧研究院執行院長秦承剛分享了卡奧斯工業大模型在助力工業企業最佳化工藝、流程、成本、效率等方面的功能。
「透過對開源大模型進行微調訓練,卡奧斯工業大模型COSMO-GPT註入了562個工業數據集,擁有300多萬條高品質工業數據、3900多個機理模型和200多個專家模型,推理準確率達到了96%以上,意圖辨識準確率達到了85%以上。」秦承剛說。
羚羊工業大模型也吸引了許多觀眾駐足體驗,他們紛紛就「地效翼船的工作原理是什麽」「生產制造焊條要依據哪些標準」等話題進行提問,大模型都能第一時間回復。在大模型的工業視覺質檢助手中,上傳一張圖片,輸入「辨識沒有戴安全帽的人」,系統很快就能準確進行判斷。
羚羊工業互聯網股份有限公司總裁徐甲甲說,羚羊工業大模型是以訊飛星火認知大模型的通用能力為核心技術底座,結合工業場景實際需求打造的大模型,具有工業文本生成、工業知識問答、工業理解計算、工業程式碼生成、工業多模態等核心能力,可以從海量數據和大規模知識中持續前進演化,實作從提出、規劃到解決問題的全流程閉環。
「過去一年,大模型的長足進步使得資訊分發獲取、內容生產、全自然互動都顯現出極大不同,逐步改變著科研範式、產業形態與市場競爭格局。」科大訊飛股份有限公司董事長劉慶峰表示,隨著「底座」能力的提升,不少技術進展將能與大模型「通」「專」結合,賦能行業發展。
不同於通用大語言模型,研發工業領域垂類大模型需要大量生產工藝、品質檢測等核心數據。菲特(天津)檢測技術有限公司創始人曹彬回憶,最初,企業雖依靠長期實踐積累了大量工業數據,但並沒想到這竟會成為公司發展的一筆寶貴財富。
「現在,這些數據成了我們技術創新的‘核心秘籍’。」曹彬說,依托數據優勢與核心演算法平台,企業研發的工業垂類大模型就像生產線上的專家「智囊團」與即時「診療師」,針對生產瓶頸與裝置故障迅速「對癥下藥」、答疑解難,並提出最佳化生產排程和調整工藝參數的建議,推動產品提質升級、幫助企業降本增效。去年,該公司實作營業收入2.33億元,收入連續三年快速增長。
工業和資訊化部賽迪研究院釋出的數據顯示,2023年,中國生成式人工智慧的企業采用率已達15%,市場規模約為14.4萬億元。專家預測,2035年生成式人工智慧有望為全球貢獻近90萬億元的經濟價值,其中中國將突破30萬億元。
「未來,透過發揮數據要素的‘融合劑’和‘催化劑’作用,現有業態和數位業態將得以進一步跨界融合,衍生疊加出新環節、新鏈條、新活動形態,推動產業升級。」天津理工大學電腦科學與工程學院教授王勁松說。
多重短板制約規模化套用
業內人士表示,以基礎大模型為技術底座、以工業套用為切入點推動AI行業發展已成為業內共識,但目前供需不匹配、數據難獲得、算力水平低等問題仍在制約大模型進一步發揮賦能效用。
——不夠「聰明」,部份產品僅能「打醬油」。多位受訪人士表示,大模型在制造業領域套用潛力巨大,但目前不少大模型仍難以匹配適應企業生產的實際需要。佛山市順德區捷通數位科技有限公司總經理廖偉權表示,企業的智慧監控終端產品需要進行視覺訓練,若有大模型幫助,可大幅提高效率,但目前市面上可用的大模型產品有限。
部份政務大模型聲稱具有工業相關內容,但其專業化水平相對較低。360集團創始人周鴻祎說,一些大模型在企業和政府內部套用時,使用者會發現其不僅缺乏行業深度,對業務也並不熟悉。「這些大模型一般是基於互聯網上的公開數據訓練而成的,往往難以滿足實際需求。」
——「各自為戰」,數據要素流動難。大規模數據是大模型能力的基礎保障,但目前數據體系建設仍存在多項短板。國家智慧網聯汽車創新中心首席科學家李克強表示,受限於工業場景碎片化、工業領域訓練數據采集整理困難等問題,單一企業開發的大模型往往存在數據量不足、完備性不夠等問題,導致大模型與行業融合套用難。王勁松認為,盡管中國擁有海量的數據資源,但是數據「孤島」和數據「煙囪」問題依然嚴峻,迫切需要找到突破口、打破數據壁壘。
同時,數據私密與版權等問題也在一定程度上制約了數據的流動。「現在的知識已經被大模型解構甚至‘像素化’了,很難直觀地看出大模型產生的內容參考參照了哪些知識、資訊或藝術風格。」清華大學新聞與傳播學院教授沈陽表示,隨著AI對人類的理解越來越全面深入,其對人類私密的侵犯也會越來越直接和嚴峻,在數據交易過程中數據版權的保護也會更加困難,這使得數據確權問題成為一項挑戰。
——算力「卡殼」,公共雲占比較低。大模型發展背後必須有龐大的算力基礎作為支撐。專家表示,公共雲是破解中國「人工智慧+」時代算力「供不上、用不起」的重要抓手,能以資源利用效率最大化的方式,讓更多的使用者享受普適普惠的算力服務,但目前公共雲發展仍存在不少短板。國家資訊中心釋出的【「人工智慧+」時代公共雲發展模式與路徑研究】顯示,2018年至2022年,中國在用數據中心機架總規模年均增速超過30%,但2022年上架率僅58%,低於全球平均水平。
國家資訊中心資訊化和產業發展部主任單誌廣認為,目前中國算力利用率仍不高,公共雲占比較低尤其制約了大模型規模化套用。
加速破局尚需多方合力
專家認為,隨著人工智慧技術和套用領域持續拓展,政府、企業等各方仍需積極參與,推出更多滿足各行業需要的垂直大模型,推動產業轉型升級和高品質發展。
首先,加快推進數據要素市場建設。2023年底,國家數據局等17部門聯合印發【「數據要素×」三年行動計劃(2024—2026年)】,旨在推動建設人工智慧高品質數據集,並鼓勵社會公益機構、大模型企業、新型數商積極參與,為大模型加速發展奠定了制度基礎。王勁松認為,應加快構建重要領域數據資源基礎庫,加速完善面向現代化產業體系建設的數據開發開放和流通使用制度體系和服務生態。在保證安全的前提下,加速建設數據要素市場,加強數據供給激勵,給予數據采集、加工、流通、套用等不同環節相關主體一定的試錯空間,鼓勵面向數據要素價值實作的科技創新和產業創新,著力推動數據高品質供給與數據創新性套用的雙向賦能和快速叠代,為發展新質生產力拓展要素配置空間。
其次,依托開發者團隊為產業賦能。劉慶峰認為,打造一支覆蓋各行業的開發者團隊,是實作大模型為產業賦能的重要保障。據介紹,2023年5月6日「訊飛星火」正式釋出以來,已新增超過273萬開發者,其中大模型直接相關的開發者數量超過52萬,企業級使用者超過32萬。秦承剛也表示,打造人工智慧開放創新平台至關重要,只有透過一系列套用場景的大規模實踐,根據使用者需求反復驗證和最佳化,才能形成符合工業轉型和高品質發展需要的智慧體,從而進一步復制推廣。
再次,專註單一領域,把大模型做小。「最近聯想、蘋果、微軟、三星都在把模型做小,要讓模型上電腦、上手機、上汽車。塊頭越做越小,能力越變越強。」周鴻祎說,目前,不宜再追求一個大模型解決所有的問題,而需強調術業有專攻,讓一個大模型解決一個專業問題,再由多個專業大模型組合起來一起為政府和企業工作。「只要思路轉變了,過去限制大模型走進政府和企業的很多問題都會迎刃而解。」
聯想集團董事長兼CEO楊元慶也認為,將小參數的大模型部署在政府和企業內部,可以保證數據安全。他表示,公共智慧與私域智慧共存、互補構成的「混合式人工智慧」,將成為大勢所趨。最佳路徑是打造人工智慧個人終端裝置,擁有強大的本地異構算力,還能夠建立個人知識庫,連線開放的人工智慧套用生態,從而帶來新的巨大增長機遇。
來源:經濟參考報