當前位置: 華文世界 > 科技

五福節成AI互動套用練兵場 支付寶技術叠代提速

2024-02-18科技

作者 | 【財經】新媒體 撰稿人 閆曉寒/文 高素英/編輯

只需要在支付寶五福節的「飆戲小劇場」上傳自己的照片,使用一張福卡,就可以一鍵變身能歌善舞的白娘子。如果還想在周星馳系列電影、甄嬛傳、鄉村愛情故事……一系列經典影視劇中成為主角,同樣也可「一秒入戲」。除此之外,會說話紅包、時空照相館以及大家來找福都引發了支付寶億萬使用者的參與熱情。

今年春節支付寶把「集五福」換成了「五福節」,別出新裁的玩法背後離不開AI套用的全面布局。2月9日,支付寶方面提供的數據顯示,今年,近6億人次透過AI科技體驗新年味,其中,「大家來找福」成為最受歡迎的集福卡方式之一,共有近30億個AI生成的福字被使用者找到。在支付寶上用AI飆戲和拍照的人群中,「90後」和「00後」占了七成。

業內人士認為,2024五福節就是支付寶AI互動套用集中大規模落地的練兵場。如果將雙11倒逼支付寶解決海量高並行數據場景下的安全順滑問題,所產生的分布式技術看作是第一次技術叠代,那麽能夠解決AI互動套用大規模落地中的算力、成本可控問題,就是支付寶正在經歷的第二次技術叠代。

五福節「大練兵」 加速AI大規模落地

作為螞蟻集團的技術老兵,雖然支付寶CTO陳亮從第一屆雙11開始完整經歷了十余年的支付壓測和技術保障,也連續9年參與到集五福活動中,但今年的集五福活動對他和團隊來說卻有著不同意義。

今年支付寶將集五福升級為「五福節」,並首次由AI全面驅動。如同以往的每次國民級活動,此次有億級使用者參與的「五福節」同樣是支付寶AI技術磨練升級的一次「大型戰場」,其首要解決的是AI規模化落地套用的問題。

「這涉及很多技術體驗和技術成本的平衡,所以我們並非強調支付寶的AI有多麽炫酷,而是要把AI落地到場景中、落地到產業中,讓AI可以為人所用,實作其產業價值和社會價值。」陳亮表示。

過去幾年,使用者參與支付寶集五福大多是AR掃福、澆水得福等傳統玩法。2024年則是一個轉折點,這一年AI及大模型迎來全面爆發,誕生了不少現象級AI套用,支付寶也在思考如何用AI改造自身業務。去年,陳亮帶領團隊第一時間參與到大模型技術叠代中,並很快將其在業務中落地。

在AI的支持下,2024年支付寶五福節推出了「飆戲小劇場」、「時空照相館」和「大家來找福」等新玩法。其中「飆戲小劇場」透過AI換臉技術,讓使用者上傳一張照片即可參演一系列經典影視作品;在「大家來找福」中,支付寶透過像素級可控生成等技術生成10萬多張藏福圖,使用者可以邊找福字邊得福卡;而一鍵生成「會說話」的影片紅包,也大幅提升了使用者拜年互動的趣味性。這是去年11月螞蟻集團的百靈大模型透過備案後,第一次在大模型技術的基礎上對產品套用進行大規模的探索。

深度科技研究院院長張孝榮認為,支付寶在五福節中大規模落地AI技術,有助於其數據積累和技術的驗證,在大規模的實際套用場景中測試AI技術,能夠幫助支付寶檢驗技術的可靠性和穩定性,為其未來的技術叠代提供實戰經驗。

迎戰算力、成本等難題 第二次技術叠代提速

實際上,支付寶以往的技術叠代都是在一個又一個「大型戰場」上得以磨練升級並實作突破。支付寶的第一次技術叠代,正是雙十一場景下的業務倒逼,推動其解決了海量高並行數據場景下的安全順滑問題,由此支付寶誕生了最關鍵的自研技術:分布式數據庫和綠色計算技術。

陳亮及其團隊自2010年就開始承擔起雙十一的技術保障,「我們透過異地多活等各種各樣的技術,解決了支付寶的分值問題,在這個過程中沈澱了分布式技術。」陳亮說道,在這過程中,他發現傳統的技術已經無法解決一些極致場景業務中存在的問題,這倒逼了支付寶技術的不斷叠代。

過去十幾年,螞蟻透過雙11錘煉的安全科技的能力、分布式計算儲存的能力已經非常成熟,並且處於國際領先地位。而在AI時代,支付寶迎來了第二次技術叠代,其核心便是解決AI互動套用大規模落地中的算力、成本可控等問題。在陳亮看來,AI大規模落地需要解決算力支撐得住、成本可控以及門檻低、使用者體驗好等關鍵問題。

在算力及成本方面,除了持續最佳化歷年雙十一積累的能力,支付寶還疊加了AI算力來支撐海量使用者同時湧入參與AI套用互動,其中包括硬件上的萬卡異構集群的能力,其硬件算力效率已超過60%;以及軟件上對推理效率和訓練效率的最佳化,其中推理效率提升了2.3倍,處於業界先進水平。此外,螞蟻的CPU利用率從2017年的不到10%,提升到了2022年的33%。

以支付寶推出的業內率先多人AI人像「時空照相館」為例,可同時支持6人同框,在單人照、雙人照、全家福的每個類別下有5到6個風格模版,每個風格模版有最多10種姿勢可選,這意味著支付寶的後台模版多達近三萬張。

而此前支付寶作為另一國民級專案杭州亞運的亞組委技術支持方,已經在推動AI規模化落地——全球1億數碼火炬手,其背後的數碼人技術為螞蟻自研,這一技術充分結合了AIGC與大模型技術,透過AI降低數碼人全鏈路生產成本。

值得一提的是,今年AI在套用層面的落地已經為部份技術人員帶來工作效率上的提升。據悉,螞蟻自研程式碼大模型CodeFuse正幫助支付寶提升可程式碼開發效率,目前,約有50%的螞蟻程式設計師在寫程式碼時都用上了該模型,AI生成程式碼占比超過10%。

此外,在使用者體驗方面,支付寶AI在此次五福節的大規模落地有兩個亮點,一方面,其能夠實作智能電話99%全覆蓋;另一方面則實作圖片流量節省約50%,更大降低使用者圖片資源的流量消耗,同時降低網絡耗時。

這些也正是行業共同存在的難題,這意味著,支付寶正透過實際套用不斷訓練自身能力,以實作技術的突破,並為行業提出值得參考的解決方案。

加速AI深度布局 多場景套用將成新增長點

近年來,螞蟻集團一直在積極布局AI領域。根據螞蟻方面數據,過去五年,螞蟻集團在國際專業學術期刊和學術會議上發表論文近500篇,其中AI領域的論文300余篇。同時,螞蟻集團在人工智能領域持續進行技術投入,基於大規模業務場景的需求,布局了包括大模型、知識圖譜、運籌最佳化、可信AI等在內的技術領域。

隨著2023年以來AI的全面爆發,螞蟻集團也開始加速布局AI套用,期待在AI領域施展拳腳,以跟上技術周期浪潮的節奏。

2023年11月,螞蟻集團旗下的百靈大模型完成備案,除了語言大模型外,螞蟻集團也在研發百靈多模態大模型,並已進入內測階段,形成了涵蓋大模型底層基礎設施、基礎大模型、行業大模型和套用產品的完整技術鏈條。

近期,螞蟻集團內部成立了專註於AI創新研發與套用的部門「NextEvo」,該部門承擔了螞蟻AI的所有核心技術研發任務,其中包括百靈大模型、數碼人等關鍵領域,今年支付寶五福節的AI互動任務便由該部門提供技術支持。

NextEvo的成立也標誌著螞蟻集團在人工智能領域的深度布局,是以全面的技術投入致力於推動AI的前沿研究和套用。

關於未來大模型的布局,陳亮表示,螞蟻做大模型在第一階段核心目標是服務好支付寶、消費金融、支付互聯等自身業務;第二階段在將大模型錘煉好之後,會將一整套大模型解決方案逐漸開源。

目前,螞蟻基於百靈大模型,落地套用場景,已研發的垂直大模型包括程式碼大模型、醫療大模型、遙感大模型、民生大模型等,這些模型集也都在服務支付寶業務。例如,使用者向支付寶智能助理咨詢掛號問題,背後就是醫療大模型在為其提供支持。

可以預見的是,螞蟻集團今年對AI的重點發力將助力其在新一輪科技浪潮中占據領先地位並提升自身競爭力。張孝榮認為,如果相關企業能夠深度布局AI並掌握先進AI技術,不僅能夠推動新的服務模式和商業模式的出現,為行業帶來新的增長點,也能夠助力其在激烈的市場競爭中脫穎而出。