當前位置: 華文世界 > 科技

昇思之路,從AI基礎軟體到生態繁花

2024-04-03科技

在今年兩會政府工作報告中,明確提出了深化大數據、人工智慧等研發套用,開展「人工智慧+」行動,打造具有國際競爭力的數位產業集群。伴隨著「人工智慧+」首次被寫入政府工作報告,各個行業、各個領域競相展開了對AI技術的探索與追尋,AI技術的發展熱情達到了全新高度。

在目前階段,AI技術是發展新質生產力的重要引擎,已經成為社會各界的高度共識。而如何讓AI技術源源不斷匯入各個生產場景,成為產業界、學術界的發展源動力,也就成為最受關註的話題。

這裏我們必須看到,任何技術的普遍發展都離不開技術的茁壯成長。比如「互聯網+」時代的到來,離不開IP網路等技術,以及社會化的網路基礎設施建設。「人工智慧+」行動的開展,也有賴於多種新型AI基礎設施的建設。其中在軟體層面,最為重要的一項就是AI框架。

AI框架是大模型的軟體底座,是各行業、各領域接觸人工智慧技術、開發大模型的第一站,也是推動產業智慧化發展的核心力量。 AI框架如何面向新時代,新任務長足發展?如何將框架的技術能力轉化為產學套用的行動力、生態發展的凝聚力?這些問題在今天都迫切需要答案。

近日,以「為智而昇,思創之源」為主題的昇思人工智慧框架峰會2024在北京國家會議中心舉辦。會上公布了全新升級的昇思MindSpore 2.3版本,並展示了昇思在產學套用,生態賦能多方面的最新進展。

如何打通一條從技術領先,到深入產學套用,賦能生態加速發展的AI之路?

在這場峰會中,昇思已經給出了自己的答案。

降本增效築通道,如何提升AI源動力?

所謂AI之路,應該是一條將底層技術高效引申到上層套用、開發生態當中,從而讓社會經濟各個層面從基礎技術中汲取營養的道路。只有這條路通暢、便捷、低成本,AI技術才能全面開花結果,「人工智慧+」行動才能夠價值最大化。

而在目前階段,想要實作這樣的AI之路還面臨著一系列挑戰。技術與產業經濟、學術研究、開發者生態之間還存在卡點和堵點。比如大模型開發成本大,難度高,各行業、各領域還難以完全掌握,再比如一些專業性強,較為復雜的領域還無法實作技術的深層滲透。總體而言,想要將AI技術變為社會經濟發展的源動力,需要從三個層面來進行升級:

1.底座層。 需要實作大模型訓練效率更高,推理部署成本更低且全面提升開發易用性,實作訓推能力全面升級,開發效率全面提升。而這尤其需要深度學習開發框架的升級與發展,在訓練、推理與開發工具等方面實作持續前進演化。

2.套用層。 AI技術需要與行業場景、科研領域進行深刻互動,實作人工智慧技術與行業專精知識的立體結合,使能行業智慧化升級,從而拓展AI技術的套用邊界,提升場景化復制能力。尤其在AI for Science等關鍵領域,需要AI技術與基礎學科研究者緊密配合、共同探索。

3.生態層。 AI技術就像其他軟體技術一樣,沒有生態不成規模,生態繁榮能達到技術越用越好的效果。而生態發展需要技術平台與產學研用各界以及無數開發者的有效互動,持續賦能。

由此可見,AI技術成為社會經濟發展的源動力,需要構築一條從底層技術到產學套用,再到生態賦能的完整通道。而這,也正是昇思正在踐行的AI之路。

AI框架:昇思MindSpore 2.3全新升級

首先一個問題,是如何讓AI技術持續創新,滿足產學各界對AI基礎軟體的期待和要求。

在這方面,昇思不斷精進。 在訓練、推理以及模型開發等方面實作立體化、協同化的能力升級。 這一思路充分體現在了最新釋出的昇思MindSpore 2.3版本當中。透過一系列升級,昇思讓大模型開發訓練更簡、更穩、更高效。

在訓練方面,昇思可以支撐大模型實作原生高效訓練。 透過原創的多副本、多流水交織等8種並列技術,使集群線性度達到90%,遠遠超過了業界不足60%的平均水平;透過整圖最佳化及下沈執行等,使得算力利用率達到55%,大幅超越了業界不足40%的平均水準;針對集群故障率高,恢復時間長的普遍問題,透過編譯快照,昇思透過確定性CKPT技術實作20分鐘完成故障恢復。

在今天的大模型時代,大規模集群化的模型訓練已經成了業界的最大痛點。昇思透過一系列基礎能力的升級,全方位破解了集群線性度、AI算力利用效率、訓練故障恢復等核心難題,讓大模型訓練不再充滿挑戰。

而在部署方面,昇思透過訓推一體的架構升級指令碼、分布式策略,以及執行時的統一,讓Baichuan2-13B推理部署在1天內就可以完成 ;在大模型推理上,透過LLM Serving 實作推理吞吐提升2倍多;透過升級模型壓縮工具金箍棒2.0,實作千億大模型壓縮至十倍。這些能力確保了AI大模型不僅可訓練,還能夠順利推理套用,打通了AI落地的最後一公裏。

除此之外,昇思還透過持續升級MindSpore TransFormers大模型套件,提供MindSpore One生成式套件等方式,全面提升開發者效率,讓開發者一周即可完成大模型全流程的開發。在重點的AI for Science領域,昇思聯合頂級科研機構和夥伴打造了AI生物計算套件,包含蛋白質結構預測、生成等20多個SOTA模型,加速相關領域的科學創新。

從訓練到推理,再到一系列開發套件的升級,昇思持續深耕AI技術,讓AI基礎能力穩固發展。

只有基礎軟體技術能夠源源不斷提供養分,才能實作AI套用發芽,AI生態開花。

產學套用之芽:以昇思構築AI for Science新範式

夯實了AI底座技術之後,需要將技術能力與套用場景進行深入結合。尤其是在復雜、關鍵的領域,比如AI for Science當中,更需要AI技術與科研工作進行跨越式探索,以此讓AI框架在無數個行業,無數個領域發芽生長。

在峰會當中,我們可以看到昇思如何與氣動外形設計這一關鍵領域進行結合,打通了AI for Science的新範式。所謂氣動外形設計,是指飛機、船舶、汽車等交通工具的氣動外形設計。這一領域事關國計民生,並且研究、驗證的成本巨大。非常適合AI大模型作為新研究工具的加入。在此前,我們經常看到AI大模型在蛋白質折疊、材料分析相關研究領域的套用,昇思與氣動外形設計的結合,又一次拓寬了AI for Science的邊界。

中國科學院院士、中國空氣動力學會理事長唐誌共表示:基於昇思MindSpore,生成式氣動設計大模型平台打破傳統設計範式,設計時長由月級縮短到分鐘級,滿足概念設計要求。未來該平台將擴充套件到航空、航天、船舶、高鐵、能源、汽車等多個氣動領域的行業,引領大型工業裝備的設計和制造能力跨越式發展。

據了解,生成式氣動設計大模型平台基於昇思AI框架完成了自主創新開發。在模型開發階段,昇思框架和流體力學套件MindSpore Flow提供全面的科學計算演算法庫和模型通用介面,提升模型開發效率。在模型的訓練階段,使用MindSpore多維分布式並列介面,基於成都智算中心算力支撐,模型和數據得以高效擴充套件。在模型部署階段,使用昇思大模型套件,可以將專業知識融入氣動設計大模型平台。

透過串聯大語言模型、氣動外形設計模型、氣動預測模型和風雷軟體等非AI工具,氣動設計大模型平台可以支撐多種氣動外形設計場景,為一系列關鍵領域提供基礎科研支撐。

在各個行業,各個科研領域,都可以看到昇思的AI技術上,長出了AI套用的新芽。假以時日,這些新芽會變成參天大樹。

AI技術也就由此開花結果,潤澤四方。

生態發展之花:全面賦能學術與生態

從產學套用這層再向上看,AI技術的未來發展,有賴於廣袤而繁榮的開發者生態。這就需要AI框架與產學各界積極合作,不斷強化人才培養與生態賦能等工作。在這一領域,昇思采取了全面賦能學術與生態的策略,透過多管齊下的方式,讓昇思的技術能力融入開發者需求,助力AI人才培養。

峰會當中,昇思MindSpore開源社群理事長丁誠公布了昇思賦能學術與生態的四項行動。

其中包括,昇思和中國人工智慧學會、鵬城實驗室合作的學術論文基金2.0,將在未來3年內攜手50多家全球AI學者,在學術領域不斷探索;昇思開發板套用創新行動,基於香橙派開發板,提供系統化的案例、教程與支持,幫助開發者快速上手、快速入門、快速打造個人化套用;昇思加速原生大模型孵化,透過激勵、專項技術支持和市場聯合推廣,支持更多夥伴從昇思遷移適配走向原生開發;昇思開源社群實習活動,透過程式碼實踐,讓開發者真正地實踐成長。

除了以轉型行動賦能生態發展,昇思還積極推動開源事業創新,凝聚開源生態。2020年3月,開源昇思MindSpore AI框架正式推出,其後得到了廣大AI開發者的積極回饋,總存取量已經達到了數千,有超過687萬下載安裝使用,在碼雲開源計畫中綜合排名第一,服務企業數量超過5500家,合作高校360所。

2023年以來,基於昇思框架發表的頂級會議論文數量超過1200篇,在所有AI框架中排名中國第一,全球第二,已成為國內最具創新活力的AI開源社群。Gitee是國內第一大開原始碼托管平台,根據Gitee 指數 2.0 , MindSpore在各類指標中表現優異,成為Gitee-AI領域分類下全品類指數 NO.1。由此,昇思MindSpore成為「Gitee中國最佳開源貢獻計畫」,被開源中國董事長馬越譽為「Gitee珍視的瑰寶」。

怒放的生態之花,開源之花,印證了昇思AI之路已經全線貫通。從AI基礎技術到各個行業套用,再到萬千開發者的信任,昇思已經構建出了全方位、立體化的AI開發底座。

在AI技術的時代浪潮裏,社會經濟希望智慧化能力能夠相容高效與穩定,既好又快發展。

昇思的AI之路,是讓技術更加紮實,套用茁壯發芽,生態向上開花。以此為基礎,AI才能生長為參天大樹,變為棟梁之材。也只有如此,時代對智慧的呼喚才能變為現實,AI技術才能夠新質生產力的源泉。