當前位置: 華文世界 > 科技

浪潮資訊釋出AIStation V5 全面支持大模型開發與高效算力排程

2024-07-11科技

7月9日,在「元腦中國行」全國巡展濟南站上,浪潮資訊釋出AIStation 人工智慧開發平台V5升級版,具備全面的大模型流程支持能力,幫助企業使用者降低構建大模型微調任務門檻,提供標準、安全的大模型推理服務,並針對大模型業務資源需求最佳化了集群管理功能,助力行業客戶快速開展大模型業務創新與落地,獲得穩定、高效、易用、高精度的大模型服務。

隨著大模型技術與產業化發展的快速叠代,企業使用者在大模型開發和套用的過程中面臨諸多新的挑戰。一方面,使用者在大模型微調過程通常會遇到環境演算法配置復雜、模型結構多樣適配繁瑣、算力資源管理難等問題,模型精度難以提升;另一方面,在部署在地化、私有化大模型時,會面臨部署經驗不足、效能最佳化瓶頸、算力資源利用不合理等挑戰,難以在保障數據與業務私密的條件下構建和使用在地化大模型套用。

AIStation V5版本功能全面升級,支持端到端的大模型開發流程,新增適配50+大模型結構,內建10+微調數據集和20+可配置參數項,提供低程式碼大模型微調能力,讓使用者一鍵送出任務、統一管理任務,低門檻構建大模型微調任務、最佳化模型效能。同時,針對大模型算力資源占用高、訓練穩定性難保障的問題,AIStation V5升級了針對大模型訓練與微調的分布式任務一鍵配置能力,幫助使用者高效、穩定地進行大模型微調。

AIStation V5整合了高效能推理服務框架,同等算力大模型批次推理服務承載量較原生部署方式提升1-3倍。透過對算力、服務、業務存取的全方位治理,以及多樣化的推理服務部署機制,AIStation V5可以滿足不同場景下使用者自研模型的部署需求,讓使用者能夠在大規模集群內更加細粒度的分配排程算力,部署和使用不同來源、不同結構、不同規模的大模型推理服務,就像在本地部署單個大模型、傳統AI套用與服務一樣簡單。

此外,AIStation V5針對大模型業務特點持續最佳化集群管理核心功能,支持平台管控的數據模型下載任務管理和匯入流程,實作了分鐘級大模型訓練異常自動恢復,能夠有效降低大模型相關業務的人力投入和管理成本;最佳化升級算力池化與分配策略,實作多團隊開發人員共用流程、共享環境,開發者與算力高效協同,助力企業客戶提升各類AI創新業務的整體效率。

浪潮資訊AIStation是面向企業級訓練與推理場景開發的人工智慧開發平台,實作從模型開發、訓練、部署、測試、釋出、服務的全流程一站式高效交付。透過統一管理計算資源、數據資源、深度學習軟體棧資源,以及支持大模型業務全鏈條,AIStation能夠為企業使用者提供敏捷高效的一體化AI平台,加快AI開發套用創新落地。