當前位置: 華文世界 > 科技

CNCC大模型時代:重塑大數據分析的新基建與新模式!

2024-10-09科技

CNCC 2024論壇:大模型時代下的新數據分析基礎設施與範式

在10月26日下午13:30到17:30,CNCC2024論壇將在秋苑的東6教室舉辦,主題聚焦於大模型時代如何顛覆現有的大數據分析基礎設施和理念。讀者請註意,具體安排可能會有所調整,最終資訊請以官網釋出為準。

隨著大模型的崛起,數據儲存、計算與處理的需求如火箭般上升,各類挑戰也隨之出現。大數據基礎設施需要面對從儲存擴充套件到計算資源利用、即時處理能力,甚至數據私密保護等眾多難題。如何打造高效且靈活的智慧數據分析基礎設施,以應對日益復雜的企業需求,這成為了技術創新的焦點。本次論壇共有多位嘉賓,深入探討雲原生數據平台與大模型如何深度融合,助力大數據平台智慧化發展。

報告內容涵蓋多個前沿技術,包括雲端運算彈性架構、大模型預訓練語料的清洗以及數據管理和分析的智慧化,展示了向量引擎、推理加速、生成式SQL最佳化乃至網路數位孿生技術如何提升數據處理和管理的效率,為Data+AI融合套用提供了期待已久的思考與實踐經驗。

論壇日程中,嘉賓們將輪番分享他們的觀點。例如,李飛飛來自阿裏巴巴,講述Data+AI驅動的雲原生數據平台所面臨的機會與挑戰。接下來,陳文光從清華大學探討了大模型預訓練語料的清洗過程,高雲君來自浙江大學則講解了怎樣開辟大數據與大模型的智慧新路徑。田臣來自南京大學,分享數位網路的數位孿生的最新探索,而王肇國則深入分析生成式SQL最佳化的方法與挑戰。

論壇主席袁野是資料庫領域的知名專家,現任北京理工大學科研院院長,致力於大數據管理與分析。參與的其他嘉賓如鄭渤龍和各位業界領軍人物,各自發表過大量高品質的學術論文,且屢獲研究獎項。

具體報告中,李飛飛提到,雲原生數據平台能夠支持大模型的發展,這是因為其彈性擴充套件和高可用性。而陳文光強調了在大規模數據處理中,清洗過程的關鍵性,采用其自研的大數據系統能有效提升效率。高雲君則分享了大數據與大模型的融合對智慧化管理的重要性。田臣介紹了借助數位孿生技術,對物理網路進行即時監控與分析的初步成果。王肇國針對SQL最佳化,探討了從手動書寫向系統輔助生成的轉變,技術的進步使得這一領域面臨新挑戰。

總結來說,CNCC2024論壇不僅為業界提供了一個重要的交流平台,還聚焦於大模型時代下,對大數據分析基礎設施進行的全新構建與思考。透過嘉賓們的精彩分享,或授權以激發更多創新的火花,未來我們期待更多有趣的套用場景與技術突破。