當前位置: 華文世界 > 科技

中國電信開源1000億參數AI模型,純國產硬件訓練

2024-10-09科技

就在我們歡度國慶時,中國電信人工智能研究院在10月2日宣布,其使用國產算力平台訓練出了一個擁有1000億參數的AI模型——TeleChat2-115B。據其在GitHub上公布的資訊顯示,開源TeleChat2-115B模型使用10萬億個高質素中英文語料進行訓練。

一般而言,AI模型訓練用的參數越多意味著其結果準確度越高。就目前而言,使用參數最多是Meta釋出的Llama模型(超過4000億個參數),然後是OpenAI的o1模型(約2000億個參數)。盡管中國電信開源的TeleChat2-115B模型參數與二者還有一定的差距,但都在千億級別,表明盡管受到美國的各種限制,但國內企業在AI領域的發展依然接近甚至達到國際領先水平。

而且,更難能可貴的是,這千億大模型TeleChat2-115B不僅「完全使用國內算力進行訓練,並且是開源的」。據中國電信人工研究院在GitHua上的公開資訊顯示,其AI訓練平台為Ascend Atlas 800T A2訓練伺服器。

稍微熟悉伺服器或AI行業的人應該都知道,這是某遙遙領先廠商完全自主研發的AI伺服器(Ascend Atlas 800T A2),其內可配置兩顆鯤鵬920系列處理器(如[email protected]核心的7265或者[email protected]核心的5250處理器),以及32個DIMM記憶體插槽,最大記憶體容量可達2TB,每處理器最大可支持40條PCIe 4.0通道。

盡管在這款AI伺服器的產品詳情頁面並沒有顯示配備何種AI加速器,但懂的都懂……

據相關資訊,中國電信擁有超過5億的有線寬頻和5G無線使用者,年收入約為5千億元。作為國內的三大營運商之一,中國電信有技術、有能力也有預算去探索國際前沿的AI技術,而其在AI領域積累的經驗成果將給全球所有企業都提供實踐參考!