當前位置: 華文世界 > 科技

天娛數科吳邦毅:空間智能時代,天娛數科推進「1+1+N」發展戰略

2024-08-28科技

8月28日,2024深圳(國際)通用人工智能大會暨深圳(國際)通用人工智能產業博覽會在深圳國際會展中心盛大開幕。大會集結了來自全球頂尖科研院所、龍頭企業的500+知名學術專家、產業專家,共同探討包括人形機器人、具身智能、大模型、多模態、AIGC等AI領域的前沿話題。天娛數科首席數據官吳邦毅博士受邀出席「2024全球人工智能大模型及套用高峰論壇」,並以【3D大模型與空間智能 讓AI從桌面邁入工業套用】為題,進行了精彩分享。

3D空間智能,是我們對真實世界全面感知、理解、互動與決策能力的一次質的飛躍。吳邦毅表示,「聚焦 AI+3D,天娛數科融合智者千問大模型、3D 數據集與可視演算法,打造了面向3D空間智能領域的元享空間智能MaaS平台,提供基礎大模型服務,加速向全場景滲透、智能體演進,以實作‘讓虛擬世界更真實,讓真實世界更智能’的目標。」

一、實作通用智能(AGI)的三個關鍵

吳邦毅指出,實作通用人工智能(AGI)有三個關鍵:

第一,空間智能是讓AGI從桌面邁入工業套用的關鍵。吳邦毅說:「3D空間智能帶來的生產力躍升,在工業領域將尤為顯著。」目前,大多數大型AI模型主要集中在2D領域,如語言處理、影像和影片分析,但在工業套用中鳳毛麟角,「本質原因在於工業場景是3D空間,而目前絕大部份大模型為語言、圖形、影片等2D模型,在工業場景套用時存在空間計算鴻溝。」與2D智能相比,3D空間智能能夠更全面地感知、理解、互動和做出決策,它重新塑造了人、機器與現實世界及虛擬世界之間的聯系,具有更強的泛化能力和創新特性。

3D空間智能透過捕捉深度資訊,使AI能夠更精確地辨識物理世界中人和物體的形狀、結構和位置,創造出更加逼真的場景,並提供更直觀的視覺化效果,讓虛擬世界更真實。同時,3D空間智能還能在三維環境中像人類一樣對視覺資訊進行高級視覺推理,突破了二維視覺的限制,讓真實世界更智能。吳邦毅認為,空間智能技術進步將為多個產業特別是具身智能、智能制造、低空經濟等產業帶來顛覆式的變革。

第二,3D大模型是發展空間智能的關鍵。提到如何發展空間智能時,吳邦毅表示:「3D大模型是推動空間智能技術發展的關鍵。為空間智能提供了多模態數據融合、空間計算、復雜場景處理、互動性增強、3D生成式AI等多方面的支持。」

在具身智能和人形機器人領域,3D多模態大模型與機器人技術的結合, 使機器人不但具備理解、記憶、推理等認知水平,還能認識和理解真實的3D物理世界,在作業場景中具備自主決策、行動與操作能力。

在智能制造領域,3D大模型透過整合人、機、物和環境的3D數據,實作了生產流程的3D重構。這不僅能提高生產和物流的效率、降低成本,還促進了產業的升級和創新。

在低空經濟領域,3D大模型能夠提升飛行器在飛行中的智能感知、辨識、導航和避障能力。透過對低空空域的環境、飛行活動和基礎設施進行3D重構,可以有效解決感知能力不足、智能化水平低、套用成本高等問題。

第三,3D數據集是發展3D空間智能大模型的關鍵。3D空間智能大模型的發展離不開大規模、高質素的3D數據訓練。高質素3D數據集的稀缺已成為行業發展的一個主要障礙。目前,最大的3D數據集Objaverse的規模僅達到百萬級別,與2D數據相比差距顯著。3D數據的采集和處理不僅成本高昂、流程復雜,而且標準化程度低,導致數據共享和復用難度加大,這些都限制了空間智能技術的發展。

吳邦毅表示:「為解決這一問題,天娛數科透過多種毫米級 3D 掃描器材,采集 3D 模型、動作、表情等多類資料來源,構建高質素多模態數據集,目前擁有超 80 萬條 3D 數據、 35 萬條多模態數據,服務 3D 多模態大模型訓練。」

二、聚焦AI+3D,空間智能MaaS平台實作演算法、模型雙備案

作為企業級AI套用拓荒者,天娛數科專註於空間智能領域的多模態大模型服務(MaaS),在AI與3D技術的結合上進行了深入的研究和布局。吳邦毅介紹,天娛數科的空間智能MaaS平台透過整合先進的演算法和模型,不僅最佳化了3D數據的處理和分析,還增強了虛擬與現實世界的互動體驗。

吳邦毅表示:「過去三年,依托空間智能MaaS平台,我們在文旅、教育、行銷、金融領域服務了近百家客戶,包括中國日報、內蒙古阿拉善電視台、雲南農職院、五芳齋、天河城、楊國福、華潤雪花等,進一步證明了公司在企業級AI套用領域的領先地位和影響力。」

吳邦毅還重點介紹了空間智能MaaS平台的兩大核心功能:「空間智能MaaS平台有兩大功能,一是AI+3D視覺化功能,為多個行業如消費、文旅、展會、金融、教育和影視提供虛擬3D場景和AI數碼人互動的大模型服務,加快3D內容的創新和更新,增強虛擬世界的逼真度;二是AI+3D數據集功能,利用高精度3D掃描技術收集模型、動作和表情等數據,構建高質素數據集,支持3D多模態大模型的訓練,並適用於空間計算、具身智能和機器人等場景,提升現實世界的智能化水平。」

此外,在技術實力方面,空間智能MaaS平台已實作演算法、模型雙備案。天娛數智者千問大模型以及「智境雲創人臉融合演算法」「智境雲創文本生成影片演算法」「智者千問大語言模型演算法」均獲得了中央網信辦備案。

結語:把握空間智能時代發展機遇,天娛數科積極推進"1+1+N"模式,建設1個全國最大規模的高質素3D數據集,開發1個國產高效能3D空間智能大模型,透過DaaS(數據即服務)和MaaS(模型即服務)實作在具身智能、人形機器人、智能制造、低空經濟等N個場景的創新套用,加速形成"技術-產品-平台-服務"的產業生態,為相關產業轉型升級註入豐富動能。