當前位置: 華文世界 > 科技

大模型訓練遭實習生破壞?字節:不涉及商業化正式專案和線上業務,網傳損失嚴重誇大

2024-10-19科技
字節跳動回應了「實習生破壞大模型訓練」相關傳聞。
近日,有傳聞稱:「字節跳動的大模型訓練被實習生入侵,註入了破壞程式碼,導致其訓練成果不可靠,可能需要重新訓練。據稱遭到入侵的程式碼註入了8000多張卡,帶來的損失可能超過千萬美元。」
10月19日,字節跳動回應稱:「確有商業化技術團隊實習生惡意幹擾團隊研究專案的模型訓練任務,該實習生已被辭退,但這並不影響商業化的正式專案及線上業務,也不涉及字節跳動大模型等其他業務。網傳‘涉及8000多卡、損失上千萬美元’嚴重誇大。」
另外,字節跳動澄清,「經核實,涉事人一直在商業化技術團隊實習,並沒有AI Lab實習經歷。其社交媒體個人簡介及部份媒體報道有誤。」
澎湃新聞記者了解到,該事件實際發生在今年6月底,實習生田某某為國內某高校在讀博士生,於2021年9月起在字節實習,因對團隊資源分配不滿,利用HF(huggingface)的漏洞,在公司的共享模型裏寫入破壞程式碼,導致模型的訓練效果忽高忽低,無法產生預期的訓練效果,而且AML團隊無法核查原因。在訊息曝出後,該名涉事實習生試圖在社交平台上辟謠,將責任甩給他人,不過很快便遭到了接近字節跳動人士的否認。
字節已成為國內大模型戰場上角逐的強勁力量。據第三方數據,基於豆包大模型打造的豆包APP月活使用者數在上半年已達到2752萬,是第二名的2.43倍,已成為國內最活躍的AIGC類(生成式人工智能)套用產品。
此前5月15日,字節正式釋出豆包大模型,主力模型在企業市場的定價只有0.0008元/千Tokens,0.8厘就能處理1500多個漢字,比行業便宜99.3%,震撼業內,不少競爭對手紛紛跟進,引發大模型行業集體性的降價趨勢。
澎湃新聞首席記者 範佳來 實習生 姚桐
(本文來自澎湃新聞,更多原創資訊請下載「澎湃新聞」APP)