大模型訓練遭實習生破壞？字節：不涉及商業化正式專案和線上業務，網傳損失嚴重誇大

2024-10-19科技

字節跳動回應了「實習生破壞大模型訓練」相關傳聞。

近日，有傳聞稱：「字節跳動的大模型訓練被實習生入侵，註入了破壞程式碼，導致其訓練成果不可靠，可能需要重新訓練。據稱遭到入侵的程式碼註入了8000多張卡，帶來的損失可能超過千萬美元。」

10月19日，字節跳動回應稱：「確有商業化技術團隊實習生惡意幹擾團隊研究專案的模型訓練任務，該實習生已被辭退，但這並不影響商業化的正式專案及線上業務，也不涉及字節跳動大模型等其他業務。網傳‘涉及8000多卡、損失上千萬美元’嚴重誇大。」

另外，字節跳動澄清，「經核實，涉事人一直在商業化技術團隊實習，並沒有AI Lab實習經歷。其社交媒體個人簡介及部份媒體報道有誤。」

澎湃新聞記者了解到，該事件實際發生在今年6月底，實習生田某某為國內某高校在讀博士生，於2021年9月起在字節實習，因對團隊資源分配不滿，利用HF（huggingface）的漏洞，在公司的共享模型裏寫入破壞程式碼，導致模型的訓練效果忽高忽低，無法產生預期的訓練效果，而且AML團隊無法核查原因。在訊息曝出後，該名涉事實習生試圖在社交平台上辟謠，將責任甩給他人，不過很快便遭到了接近字節跳動人士的否認。

字節已成為國內大模型戰場上角逐的強勁力量。據第三方數據，基於豆包大模型打造的豆包APP月活使用者數在上半年已達到2752萬，是第二名的2.43倍，已成為國內最活躍的AIGC類（生成式人工智能）套用產品。

此前5月15日，字節正式釋出豆包大模型，主力模型在企業市場的定價只有0.0008元/千Tokens，0.8厘就能處理1500多個漢字，比行業便宜99.3%，震撼業內，不少競爭對手紛紛跟進，引發大模型行業集體性的降價趨勢。

澎湃新聞首席記者範佳來實習生姚桐

(本文來自澎湃新聞，更多原創資訊請下載「澎湃新聞」APP)