中國電信開源1000億參數AI模型，純國產硬件訓練

2024-10-09科技

就在我們歡度國慶時，中國電信人工智能研究院在10月2日宣布，其使用國產算力平台訓練出了一個擁有1000億參數的AI模型——TeleChat2-115B。據其在GitHub上公布的資訊顯示，開源TeleChat2-115B模型使用10萬億個高質素中英文語料進行訓練。

一般而言，AI模型訓練用的參數越多意味著其結果準確度越高。就目前而言，使用參數最多是Meta釋出的Llama模型（超過4000億個參數），然後是OpenAI的o1模型（約2000億個參數）。盡管中國電信開源的TeleChat2-115B模型參數與二者還有一定的差距，但都在千億級別，表明盡管受到美國的各種限制，但國內企業在AI領域的發展依然接近甚至達到國際領先水平。

而且，更難能可貴的是，這千億大模型TeleChat2-115B不僅「完全使用國內算力進行訓練，並且是開源的」。據中國電信人工研究院在GitHua上的公開資訊顯示，其AI訓練平台為Ascend Atlas 800T A2訓練伺服器。

稍微熟悉伺服器或AI行業的人應該都知道，這是某遙遙領先廠商完全自主研發的AI伺服器（Ascend Atlas 800T A2），其內可配置兩顆鯤鵬920系列處理器（如[email protected]核心的7265或者[email protected]核心的5250處理器），以及32個DIMM記憶體插槽，最大記憶體容量可達2TB，每處理器最大可支持40條PCIe 4.0通道。

盡管在這款AI伺服器的產品詳情頁面並沒有顯示配備何種AI加速器，但懂的都懂……

據相關資訊，中國電信擁有超過5億的有線寬頻和5G無線使用者，年收入約為5千億元。作為國內的三大營運商之一，中國電信有技術、有能力也有預算去探索國際前沿的AI技術，而其在AI領域積累的經驗成果將給全球所有企業都提供實踐參考！