當前位置: 華文世界 > 科技

百川智慧和零一萬物否認停止預訓練大模型

2024-10-14科技

經濟觀察網 記者 任曉寧 10月12日,針對旗下大模型已經停止預訓練的傳言,零一萬物和百川智慧均對經濟觀察網做了否認。

近日有傳言稱,「大模型六小虎」中已有兩家企業停止預訓練。「大模型六小虎」通常被業界用來形容6家頭部大模型創業公司,包括智譜、MiniMax、百川智慧、零一萬物、階躍星辰、月之暗面。

其中有幾家公司近期出現了較大的動作。智譜與MiniMax釋出了視訊模型,月之暗面釋出大模型版本更新,階躍星辰釋出了萬億參數大模型。相比而言,百川智慧和零一萬物今年動作較小,因此被外界猜測是已停止預訓練的兩家企業。

預訓練是一種深度學習模型的訓練策略,這種策略可以讓模型學習到更多資訊,不斷提高模型效能。停止預訓練,意味著企業將不再投入資源研發新模型,而是利用已有的模型進行套用開發,企業的發展方向將發生重大變化。

對於上述傳言,零一萬物創始人李開復10月11日晚上在朋友圈發文說,零一萬物一直在做預訓練,去年和今年釋出的Yi-34B、Yi-Large、Yi-Coder、Yi- VL、Yi-Vision都是釋出時全球第一梯隊,國內領先的預訓練模型。而且零一萬物的新預訓練模型也即將推出。

據經濟觀察網了解,李開復所說的新預訓練模型將於下周釋出。

百川智慧也否認了停止預訓練的說法。百川智慧向經濟觀察網回應,百川智慧的預訓練團隊穩定,預訓練工作正在穩步推進,並不存在放棄預訓練一說。

今年5月,百川智慧釋出了千億參數模型Baichuan 4,其今年的重點發展方向是AI醫療。百川智慧方面稱,其在基礎模型和AI套用方面均取得了階段性進展,相關成果將很快面世。

今年以來,有一批大模型公司停下了研發的腳步。據經濟觀察網統計,截至2024年10月9日,在188個透過網信辦生成式人工智慧備案的大模型中,超過三成的大模型在透過備案後未進一步公開其進展情況,僅有約一成的大模型仍在加速訓練,接近一半的大模型轉向了AI套用的開發。

一位大模型技術人士告訴經濟觀察網,預訓練既要燒錢又要燒數據,對中小公司來說,當投入與報酬不成正比時,及時止損是正確的選擇。但同時,預訓練模型也是大模型公司的底層核心技術,頭部公司和大廠不能停止預訓練,停了就意味著走下牌桌。