當前位置: 華文世界 > 科技

數據產業新實踐:密態計算技術邁向商業化

2024-10-15科技

密態計算技術第一次讓數據要素流通這件事在產業端有機會得到大規模驗證。

作者|栗子

數據產業的爆發,或許比預期來的更早。

9月27日,一份重量級檔悄然落地,為中國的數據產業發展畫下清晰的路徑圖。

國家數據局就【關於促進數據產業高質素發展的指導意見】(下稱【意見】)公開征求意見。意見提出,到2029年,數據產業規模年均復合增長率超過15%;數據技術創新能力躋身世界先進行列,數據產品和服務供給能力大幅提升。

在產業界,數據要素市場的建設正在提速,快速集聚政策、資金、人才和技術。在2024外灘大會上,北京交通大學資訊管理理論與技術研究中心特聘教授張向宏預測,到2030年,數據產業規模有望達到7.5萬億元。

前景可期的另一面是,當下數據產業發展面臨的制約和現實挑戰,也同樣是嚴峻的。

「數據決定了AI能力的上限。但我們看到今天的數據供給嚴重不足,很多數據主體不願意供給數據,這對AI和產業的發展都是致命的。」螞蟻集團副總裁兼首席技術安全官、螞蟻密算董事長韋韜表示,「當前行業數據交易規模已達900億,離大家預期的萬億、十萬億還有相當的距離,下面仍存在大規模、有深層次價值的數據,需要更復雜的數據融合套用才能把價值挖掘出來。」

尋求這個問題的答案,還是要回歸技術突破,以及數據基礎設施創新。

9月25日,在第三屆全球數碼貿易博覽會上,杭州市宣布建成全國首個密態計算中心,為數據產業生態中的數據提供方、加工方和使用方等提供全生命周期的密態安全保障和大數據「存算研治用」的全面能力。

這是密態計算技術首次套用在數據流通基礎設施的構建中,具有標誌性意義。

杭州密算中心由杭州市數據資源局和杭州市發展和改革委員會共同推動,浙江算力科技有限公司與螞蟻集團旗下的浙江螞蟻密算科技有限公司聯合打造,由螞蟻密算提供技術支持。

螞蟻集團副總裁兼首席技術安全官、螞蟻密算董事長韋韜分享杭州密算中心背後的技術原理

自2016年起,螞蟻集團就開始布局私密計算技術和規模化的產業套用,推進技術生態建設和合作,開源可信私密計算的核心技術,參與國內外技術標準制定等。今年對外公布密態計算技術體系,推動產業實踐,並成立密態計算公司——浙江螞蟻密算科技有限公司。

密態計算也開始邁入了商業化的新起點。

1.數據安全流通的新變量

「數據放在那裏沒有意義,只有流動起來才會產生價值。」韋韜在訪談中向「甲子光年」表示。

這是產業界當今最大的共識之一。全球產業數碼化不斷深入,要解決一個三角問題:實作數據價值高效流轉、數據安全保護、以及商業可持續。

兩個新的變量已經顯現:在AI大模型橫空出世之後,高質素數據供給、數據安全融合等問題,在新的產業變革趨勢下,變得更為緊迫;當大規模、高價值的數據流通時代到來,亟需新的技術解決方案和基礎設施。

但問題在於,數據作為特殊的生產要素,在流透過程中非常容易容易被拷貝、分割和篡改。

「比如原本你的數據可以賣給行業內的1000個客戶,但因為數據極為容易被復制,可能你賣到第10個客戶時,整個行業就都有了。」

事實上,數據的價值與風險高度掛鉤。數據的價值越大,其潛在風險也越高。

這些「高價值、高敏感」數據一旦泄露,不僅會帶來商業損失,還可能因為數據本身所涉及到的個人資訊和商業機密而面臨法律責任。

一個最典型的案例是,2018年,Meta曾因劍橋分析醜聞中的私密問題,被美國聯邦貿易委員會處以50億美元的罰款。

另外,比商業損失更嚴重的問題,是數據產品從供給端和流通端的不足。

據「甲子光年」觀察,全國首個大數據交易所——貴陽大數據交易所自2015年4月掛牌以來,近10年累計交易額為47.87億元;而成立於2021年11月的上海數據交易所,其第一年的交易額也僅突破1億元。

數據價值釋放的載體,是面向產業需求、種類豐富的數據產品。然而,高價值、高敏感數據的供給和流通,過去都因技術上的難題和挑戰而難以推進。

數據產品供給的短缺,既缺乏數據融合,也缺少安全高效的研發新範式。當市場不能提供豐富的數據產品時,數據在產業端的大規模套用也就無從談起。

數據要素流動的安全性問題並非不能保障。在過去很長一段時間裏,私密計算都是行業的普遍選擇。

但隨著數據進入大規模流通的時代,跨主體、跨機構、跨行業、跨地域的流轉成為主流。此時,傳統私密計算技術的限制也逐漸顯現。

2.從私密計算到密態計算

縱觀過去幾年的市場表現,私密計算在數據產業中是「看上去很美」的存在。

根據上海數交所此前釋出的【2023年中國數據交易市場研究分析報告】顯示,2022年中國數據交易市場規模為876.8億元;然而,分析機構艾瑞釋出的【2023年中國私密計算行業研究報告】指出,2022年同期,私密計算市場規模僅約12.5億元。

「傳統私密計算的成本動輒是明文分布式計算成本的千倍甚至萬倍,很多企業承擔不起。」韋韜向「甲子光年」表示。

而這背後,主要是由於私密計算技術涉及密碼學、人工智能、電腦體系結構等多學科的交叉融合,技術開發難度大、門檻高,研發成本居高不下。

在成本之外,傳統點對點的私密計算難以保證多步計算的中間結果都處於密態,會導致數據泄露及合規風險,並且在處理大規模數據時很容易遇到效能瓶頸。成本、效率、標準不一等等一系列現狀,導致傳統私密計算難以支持數據大規模互聯互通時代的需求。

面對大規模數據流通需求,亟需新的數據安全流通的技術路線。

現代電腦科學的創新突破,往往也由於規模的指數級增長,倒逼基礎設施建設的革命性升級。在近20年來的互聯網行業,行業分別經歷了大型電腦、小型機、分布式和雲端運算等為主導的時代,背後的本質都是圍繞數據和計算的變革。

在2024年外灘大會上,阿裏雲創始人王堅在分享中參照了Pascal的發明人寫過的一句話——「一個嬰兒的速度的1000倍就是一架噴射機。在我們世界裏面,任何事情的規模增加1000倍,它就會發生天翻地覆的變化。」王堅說。

探索下一代的私密計算技術——這也是韋韜團隊在過去幾年的核心目標。

今年5月,螞蟻集團公布了「密態計算」技術體系,並在6月專門成立浙江螞蟻密算科技有限公司,由螞蟻集團副總裁兼首席技術安全官韋韜擔任董事長,推動數據跨雲跨端低成本可信流通。

不同於市場上的私密計算公司,螞蟻密算的產品致力於解決更棘手的問題,推動大規模數據的安全流通。

在成立後的三個月來,動作不斷:7月的世界人工智能大會上,螞蟻密算釋出了旗下首款產品——「隱語雲」大模型密算平台;9月初的2024外灘大會上,釋出「隱語雲」大數據密算平台;9月底的2024數貿會上,全國首個密態計算中心落地杭州,螞蟻密算提供技術支持。

韋韜認為,未來大規模高價值的數據要素流轉,一定是以密態的形式進行跨雲、跨地域和跨行業的流轉、融合和計算,密態計算將是數據要素可信流通的重要支撐技術。

3.什麽是密態計算?

簡單來說,密態計算就是綜合利用密碼學、可信硬件和系統安全技術的私密保護計算技術,計算過程中數據「可用不可見」,計算結果保持密態化,以支持構建復雜組合計算,實作計算全鏈路安全保障,防止數據泄漏和濫用。

「對比傳統的私密計算,密態計算有兩個最大的特點:更安全、更便宜。」韋韜表示。

在安全層面,密態計算綜合利用密碼學和可信硬件等安全技術,確保數據在整個研發周期中全程保持加密狀態,實作全鏈路安全保障不依賴任何數據運維方的管控。在密態管控域中,各方可以對數據進行密態研發,並可以進行跨主體的可信審計。這種全鏈路數據流轉套用的密態保障能力,是數據行業的一個重要突破。

而在成本層面,傳統的私密計算完全不依賴任何可信計算方,因此密碼協定的成本和互動成本較高。而密態計算透過引入可信硬件,可以大幅簡化密碼協定和互動過程,顯著降低計算成本並提高處理速度。

除了上述兩點之外,數據價值的快速驗證,也是密態計算實作數據要素在產業端流通的重要優勢。

在韋韜看來,數據價值驗證是整個數據流透過程中最重要的標誌點。

「因為數據價值往往需要多方驗證。假如你能讓業務方快速驗證數據價值,那麽他們一定會積極推進數據要素流通的整個鏈條。」

多方數據密態匯聚——數據密態研發——數據場景價值高效驗證——「數據要素×」聚變效應發生, 這是螞蟻密算希望透過密態計算在產業界推動的鏈條反應。

以杭州密算中心為例,由於密態計算的安全性,數據加工方可以像使用明文計算框架一樣,編寫套用層程式碼進行數據分析,持續研發出新的數據產品。杭州密算中心可以對多源真實數據進行價值測算和評估,快速匹配數據加工方和需求方,有效解決數據質素評估與產品定價等難題。

當產業中的數據提供方和數據使用方都能夠放心去進行數據研發,那麽數據要素市場中的數據產品將會更加豐富。加上密態計算更低的使用成本,數據要素無疑將會在產業端實作快速流通。

4.產業落地,密態計算迎難而上

盡管密態計算在技術層面實作了跨越式的提升,但密態計算要想真正實作大規模落地,還有幾個現實挑戰需要解決。

企業客戶最在意的,依舊是數據安全問題。密態計算能否真正保證全鏈路密態,保障數據全生命周期安全。

對此,螞蟻密算的解法是,透過綜合利用密碼學、可信硬件和系統安全技術,計算過程中數據「可用不可見」,計算結果保持密態化,以支持構建復雜組合計算,實作計算全鏈路安全保障,防止數據泄漏和濫用。

以杭州密算中心為例,為數據在流透過程中提供明確級別、全鏈路安全保障,覆蓋儲存、計算、研發、治理和營運的數據全生命周期,包含數據資源密態儲存、密態數據使用授權、數據產品密態研發、數據密態流通交易等功能,構建一體化數據要素可信流通體系。

其次,在成本方面,客戶也存在一定的考量,密態計算到底能有多便宜?

據韋韜介紹,螞蟻密算透過可信芯片和機密計算進行協同保障,對於保護極為敏感數據的方案,密算成本控制在明文計算10倍以內;對於保護一般高價值數據的方案,密算成本可以控制在明文計算的2-3倍以內。

他認為,要控制密態計算的成本,需要引入基礎設施,像水網、電網一樣,為個體和機構提供規模化的服務。有了基礎設施,就能夠透過規模效應把成本降下來。以杭州密算中心為例,雲上的大規模密態計算能力使得處理海量數據更高效,降低單位數據的處理成本。

「密態計算一定是從高價值的數據和場景開始套用,但它解決的是全市場需求。」韋韜說,當規模化後成本降低並突破臨界點時,將會迎來大規模的落地。當全鏈路密態計算的成本是整個數據流通價值的5%左右時,就能夠實作規模化推廣。

最後是標準化問題。

由於密態計算涉及到的加密演算法等技術路線缺乏統一的安全標準和技術規範,導致不同廠商和機構之間難以實作互聯互通。韋韜直言,這並不只是國內的問題,而是一個世界性難題。

為了最大程度解決這一問題,螞蟻密算參與制定了多項技術標準,推動了產學研合作。例如與政府部門、科研機構共同制定數據安全標準,推動數據要素市場的規範化發展。

「密態計算是一個非常嚴謹的技術,它同樣要面臨‘安全要求’‘規模復雜度’‘單位成本’的‘不可能三角’。我們希望能夠盡最大可能擴大這個三角。」韋韜說。

盡管密態計算在產業側的落地尚存不少挑戰,但已經在金融服務、醫療健康、現代農業等領域落地。

比如,在農業領域,過去農業數碼化程度低,涉農數據「孤島化」,難以滿足銀行授信風控要求,難以獲得信貸支持。農業農村部大數據發展中心與網商銀行發起「農戶秒貸」專案,透過螞蟻集團密態計算技術,安全融合多源數據,實時分析,掌握農戶經營情況,手機一點就能「秒貸秒批、隨借隨還」。

截至今年5月,超600萬農戶獲得了銀行貸款服務,近8成農戶種植面積在10畝以下,是以往農村金融難以覆蓋的「毛細血管」。 這一套用入選了國家數據局等釋出的首批「數據要素×」典型案例。

5.密態計算的真正價值

如果把數據要素流通比喻成「用水」,那麽最早對數據要素的使用就像自家的井水,自產自銷;數據點對點流通的私密計算像是桶裝水;而密態計算,則是數據要素流通的自來水階段的管道技術。

毋庸置疑,杭州密算中心的建立,讓國內密態計算的產業化落地邁出重要的一步。

在「甲子光年」看來,杭州密算中心不僅在技術層面確保了數據以密態形式進行匯聚、處理、流通、套用和營運,實作全鏈路的安全保障,平衡數據安全保護與數據價值發揮,還能將公共數據與產業數據等多源數據進行密態匯聚,透過密態研發加速真實業務場景中的價值驗證, 基於技術信任推動高價值數據產品的規模化推廣。

這意味著,密態計算技術第一次讓數據要素流通這件事在產業端有機會得到大規模驗證。

根據【2023年中國數據交易市場研究分析報告】的測算,2030年,中國數據交易市場規模有望達到5155.9億元。

在「甲子光年」看來,對於產業來說,上萬億規模的數據要素市場就像一個巨大的堰塞湖,產業需要將水源安全且低成本的引入。而密態計算就像產業的水渠一樣,讓高價值、高敏感數據得以安全、高效、低成本的方式進行流通,數據要素的價值無疑將在產業端得到進一步釋放。

而在這一過程中,螞蟻密算作為今年剛剛成立的,透過持續的技術突破、商業生態和產業合作,給數據產業帶來一種新的可能性。

「十幾年前雲端運算剛推出的時候,很多人一開始還沒意識到它的價值。但真正上雲、上規模後,帶來了本質的改變。」韋韜說,「今天密態計算也是如此,我們認為行業將從智算走向密算,這一演變速度及對中遠期的影響,將比我們今天想象大得多。」

(封面圖及文中配圖來源:螞蟻密算)