當前位置: 華文世界 > 三農

星環科技CEO孫元浩:模型價格戰對企業使用者幫助有限

2024-06-02三農

·企業使用者對模型精準要求高,要求解決實際問題,即使是最大參數模型也不一定能達到企業要求,所以大模型卷價格對企業使用者而言並不十分有用。通用大模型更應提升模型精準度和模型效果,才能真正具備競爭力。

·要讓大模型變成「理科生」,成為專業領域的專家模型。大模型的新趨勢是用RAG(檢索增強生成)和Agent(智慧體)技術提升模型精準度,或將湧現出一批Agent,構建Agent的過程就是教大模型如何使用內部工具。

星環科技創始人、CEO孫元浩。

「大模型卷價格對企業使用者來說幫助並不大,企業使用者對模型的精準度要求高,通用大模型更應透過提升模型精準度和模型效果,贏得競爭力。」5月31日,企業級基礎軟體供應商星環資訊科技(上海)股份有限公司(星環科技,688031)創始人、CEO孫元浩在向星力未來數據技術峰會期間接受采訪時作出上述表示。

僅依靠低價很難讓使用者形成黏性

近期,國內通用大模型價格戰打得火熱,科技巨頭紛紛參戰。孫元浩表示,這是由中國特殊生態造成的。在他看來,眼下降價的都是一些小模型,但企業使用者對於模型的精準度要求很高,希望能夠解決實際問題,當前即使是市場上最大參數的模型也未必能達到企業要求,所以降價對企業使用者而言幫助有限。「企業的要求遠比現在的模型能力高很多」,據他所知,有的企業部署了五六個模型,但沒有一個達到要求。

在孫元浩看來,僅依靠低價很難讓使用者形成黏性,「降價是為了給開發者提供低廉的Token價格,基於通用大模型開發套用,從而試圖構建生態,收集高品質數據。但事實上,模型是很容易被替代的,使用者想換就換,因為介面全部是自然語言,沒有額度限制。」

去年,孫元浩判斷,要讓大模型變成「理科生」,成為專業領域的專家模型。今年,他認為大模型的新趨勢是還需要用RAG(檢索增強生成)和Agent(智慧體)技術提升模型精準度。「現在大家又開始開發Agent,可能馬上會出現成千上萬個Agent,這可能是現在大模型能力不夠造成的,模型沒辦法聰明地學習現在該用什麽工具、怎麽用,構建Agent的過程就是教大模型怎麽使用內部工具。」

大模型落地,每個環節都有挑戰

目前,通用大模型數量快速增加,並不斷升級叠代,但卻不能完全適應企業AI套用需求。企業對行業大模型需求增加,迫切需要降低使用門檻。「現在每個大模型套用開發都要很久,重復訓練量很大。我們想把整套AI基礎設施建好,使用者再在大模型上開發套用就快了。」孫元浩表示,過去一年幫助企業客戶落地大模型時,發現每個環節都遇到了挑戰。為此,星環科技開發了語料處理、模型訓練、知識庫建設等工具鏈,就是為了幫助企業建立行業大模型,快速使用AIGC。

在AI基礎設施中,星環科技無涯大模型Infinity可為各行業客製自有大模型,提供意圖理解、語意召回、數據處理和分析能力。基於無涯大模型,星環科技推出無涯·問知、無涯·問數、無涯·金融、無涯·工程等AI原生套用,可套用於金融、能源、制造、工程等領域。

孫元浩表示,大模型擅長生成文本,但回答嚴肅問題不可控,為此團隊經過微調、增加語料,將模型訓練成「理科生」,同時將企業內部數據知識化,利用RAG提升模型準確度。

語料品質決定了模型品質,高品質語料也是解決行業大模型幻覺、可信可控等核心落地難點的重要手段。孫元浩表示,大模型結構已不是秘密,訓練方法也不是秘密,但語料散落在各種地方,導致工作量大,「目前最大的挑戰是把現有資料整理起來訓練或微調模型,企業套用要求100%準確,所以用現在的語料還不夠,我們正在構建知識圖譜用於推理,再結合大模型提升準確度。」