當前位置: 華文世界 > 科技

OceanBase客戶數破2000家,首批分布式資料庫透過安全測試

2024-10-26科技

作者 | 徐豫
編輯 | 心緣

智東西10月25日報道,在10月23日舉行的OceanBase 2024年度釋出會上,OceanBase資料庫OceanBase 4.2.5 LTS、OceanBase 4.3.3正式釋出,OceanBase 4.4開啟內測,OceanBase雲資料庫即日起免費提供365天的試用期。而OceanBase首批分布式資料庫今年已透過中國資訊保安測評中心的「安全可靠測評」。

基於單機分布式一體化架構和AI技術,OceanBase資料庫大幅最佳化了可延伸性、實分時析、消除數據孤島、跨雲部署、多模態、向量搜尋、容災等方面的效能。

同時,有了專有雲和公有雲服務「雙引擎」加持,今年OceanBase的客戶數成功突破2000家,行業解決方案夥伴增速超100%,熱門解決方案落地增速超50%,核心經銷商夥伴業績占比超60%。

一、新版資料庫正式對外開放,強化即時數據處理水平

OceanBase CEO楊冰正式宣布推出OceanBase 4.2.5 LTS版本和OceanBase 4.3.3第一個GA版本。

OceanBase 4.2.5 LTS版本相較於此前的4.2.1 LTS版本TP效能提升了26%,小規格4C TP效能則提升了37%,系統的處理能力得到較大提升。

同時,其融合了OBKV-HBase和OBKV-Redis兩個不同模態的資料庫,可以兼顧HBase的大規模數據儲存和處理優勢,以及Redis的快取和即時讀寫能力。

此外,據OceanBase CTO楊傳輝透露,該版本還可相容甲骨文的資料庫,使用者托管在甲骨文資料庫5.7版本的數據,可以不改程式碼平滑遷移至OceanBase 4.2.5 LTS版本的資料庫。

與4.3.0版本相比,OceanBase 4.3.3版本TPC-H 1T提升了64%,TPC-DS 1T提升了36%,寬表效能ClickBench hot-run提升了49%,還新增了向量檢索能力。

楊傳輝稱,該版本是面向即時AP場景的第一個公開版本,相容特定的數據型別,支持快速匯入匯出,並且針對特定場景預設了AP參數樣版,免去了使用者重新補充參數的功夫。據楊冰透露,過去一年已有大約60個客戶試用該系列的小版本,並給出了不錯的使用反饋。

二、采取單機分布式一體化架構,兼具效能和成本優勢

對於資料庫而言,其采用集中式架構通常會在相容性、易用性、單機效能上較為突出,而選擇分布式架構則更多是在擴充套件性、可用性和成本上占優勢。

OceanBase的資料庫則依靠的是「單機分布式一體化」架構,既考慮到分布式架構的擴充套件性,又具備集中式的功能和單機效能,還能同時處理結構化和非結構化數據。

楊傳輝解釋道,這是因為OceanBase希望能用一個資料庫,去解決至少80%的數據問題,使資料庫變得普惠和通用。

從OceanBase多個實際客戶案例中可以看到,企業使用者選擇單機分布式一體化架構後,等同於只花費一個系統的錢,能獲得兩份甚至多分復合收益。

例如,山東移動此前用的是甲骨文資料庫,基礎設施基於傳統「IOE」架構,擴充套件能力受限,也難以應對高峰期流量和復雜查詢場景。其轉用OceanBase的資料庫後,計費系統效率提升了近30%,整體成本降低了9成。

同時,透過跨多數據中心分布式集群部署,山東移動的資料庫能達到機房級別的容災效果。

三、AI Agent的數據底座,可理解並執行復雜語意

OceanBase將其一體化資料庫視作AI時代的數據底座,旨在讓AI技術像資料庫一樣通用。目前,AI技術已滲透該公司資料庫的開發、運維、診斷等環節。

如果用不同的資料庫處理不同型別的數據,這通常存在研發成本高、傳輸過程復雜、查詢路徑繁瑣等弊端。楊傳輝稱,在通用資料庫中整合向量外掛程式後,OceanBase的所有底層能力都可以直接復用。

除此之外,OceanBase一體化資料庫還融入了LangChain、Llamaalndex、DB-GPT等主流AI技術棧。

現場楊傳輝用ANN Benchmarks基準測試驗證OceanBase一體化資料庫的向量效能。從測試結果來看,其向量引擎在準確率、速度等多維度上超過業界頭部水平。

在C端套用方面,OceanBase與螞蟻集團的生態建立了緊密結合。支小寶、螞小財、支付寶百寶箱Agent,以及包括AI健康管家在內的3個螞蟻集團AI管家,它們的數據底座都用的是OceanBase一體化資料庫和架構。

其中,支付寶百寶箱Agent是一個搭載了AI能力的小程式。該Agent可以讀懂復雜語意,為使用者檢索、篩選、推薦吃喝玩樂的店鋪。

楊冰稱,此類Agent背後需要涉及復雜的語意互動,過去通常依賴大量地理位置、向量的儲存來實作這一功能,產品開發周期也長。而得益於OceanBase一體化資料庫和架構,該平台僅由兩名開發者耗時一周的時間,便實作了從構思到產品的落地。

▲在支付寶百寶箱Agent的聊天框中輸入「推薦距離兩公裏以內,人均消費25元以下,評價4.5分以上,不用排隊的奶茶店」

四、公有雲和專有雲成為商業化雙引擎,超6成客戶為千億級規模

除了OceanBase一體化資料庫和架構,該公司的多雲服務也實作了全新升級。

OceanBase上新Free Trial入口,即開發者可以在一年內免費試用OceanBase雲資料庫,也能自由選擇所需的雲服務商。此外,OceanBase雲資料庫不久後將在阿裏雲精選市場中開放接入。

而OceanBase 4.4實驗室版本正式開啟內測,主推存算分離和共享儲存架構。

迄今為止,主流電腦的資源利用率大部份情況下只有個位數。OceanBase創始人兼首席科學家陽振坤建議,若想給客戶帶來「用一份硬體的錢買到了兩份硬體」的使用體驗,公有雲、專有雲、行業雲等多雲服務一方面可以透過資源池化和復用來降低成本,另一方面可以透過動態伸縮和按需使用提升效率。

據楊傳輝透露,OceanBase雲資料庫已經在公有雲上實作基於物件儲存的存算分離,並且用起來「價效比高」。

經過4年的商業化摸索,OceanBase今年客戶數突破2000家,連續4年增速超100%,並且中小客戶占比相較於去年進一步擴大至80%。

當前,該公司形成了「雙引擎」的商業發展模式,主要增長動力來自專有雲服務。從2022年到2024年,其專有雲客戶數增速達到50%,包括中國南方航空等航空公司,北京、西安等多地地鐵營運商,匯豐銀行、交通銀行等金融單位。

而同期其公有雲客戶數增速為130%,成為OceanBase的第二增長引擎。其客戶集中於零售、智慧制造、互聯網金融行業,包括小米、科大訊飛、Vivo等高增長公司和行業獨角獸。

楊冰稱,超千億交易規模的支付企業和超千億規模的消費電子企業均超6成在使用OceanBase公有雲服務。

兩年前,OceanBase曾在當時的年度釋出會上宣布了其「珊瑚計劃」,旨在構建一個以合作夥伴為中心的商業生態模式。該計劃的核心目標是在未來3年內與60家核心經銷商達成合作,並且合作夥伴的收入占比達到60%以上。

從今年的戰果來看,該公司超前完成了這一目標。現在OceanBase累計有超150家核心經銷商,簽約占比達70%,業績占比超過6成。未來該公司將持續下沈二線、三線、四線城市,並計劃在出海市場中尋求新的增長動力。

五、無論是金融還是出行產品,都需要一個國產的、更安全的資料庫

OceanBase的生態合作夥伴覆蓋了金融、政務、交通、能源、科技、公共服務等多個領域。在【共話雲和AI時代的資料庫】的圓桌論壇上,部份生態合作夥伴分享了他們對於OceanBase新版資料庫的第一感受。

據IDC中國副總裁兼首席分析師武連峰透露,雖然全球已有17%的企業把生成式AI技術套用到企業生產的過程中,但實際上只有11%左右的企業真正落地了「DateBase for AI」,或者「AI for DateBase」,主要是因為準確率達不到95%的標準。

中國人保財險科技營運部副總經理張帆稱,單庫40個TB的數據處理是基操,資料庫的安全性和穩定性也愈發重要,因此保險行業未來更需要一個國產化的、多模的、支持多雲的、可靠的、具有AI能力的資料庫產品。

T3出行資料庫負責人高建豐認為,數位化出行的排程過程需要大量即時數據來支撐。因此,一個實分時析能力強,並且可以節省人力、物力、研發資源,低成本可用的資料庫產品,在他看來是一種更好的技術解決方案。

中國聯合航空有限公司資訊中心總經理馮振宇則將資料庫和AI的關系,比作「好馬配好鞍」。在他看來,OceanBase資料庫的新版本、新產品可以將原有的系統原封不動地整合到新的平台下,能夠把現有的資產盤活,變成真正的數位資產,已經稱得上是「好馬」。

同時,OceanBase結合AI技術,為其架構推出全新的向量搜尋能力。馮振宇認為,這不僅拓寬了圖片等數據資產的範圍,也使AI初具「馬鞍」的雛形。

六、AI時代的新風口,「讓數據好用,把數據用好」

錢衛寧是華東師範大學數據學院院長和CCF資料庫專委會常委。此次OceanBase 2024年度釋出會上,他也受邀分享了自己在資料庫領域,從學生身份轉變到導師身份這一過程中的觀察。

他認為AI行業中的核心變化是數據智慧的變化。從某種程度上來說,「互聯網企業是最早的AI企業,」錢衛寧解釋道,人們很早就開始嘗試把手頭上的事情交給機器去做,這也意味著人們逐步建立起對底層資料庫的信任。

隨著互聯網行業不斷重構各行各業,該行業內逐步孵化出了數位化這一概念。數據可視作一種「新能源」,如何在新的AI時代中將其真正大眾化,將其變得「唾手可得」。在錢衛寧看來,這是對資料庫廠商的關鍵考驗。

目前,基本上每個大型企業都部署了專用的資料庫。然而,同時線上使用資料庫的使用者在數量和使用方式上都愈發不可控,原本單機形式的資料庫已經不足以滿足使用者需求,也因此催生了分布式數據技術和分布式資料庫,讓企業能夠以更低的成本來管理好數據。

分布並列資料庫、雲原生資料庫和開源資料庫是未來資料庫的三大衍生方向。錢衛寧稱,「現在是中國資料庫最好的時代」,而類似於OceanBase的做法,去整合、協同不同垂直領域的資料庫,則是新的機遇。

結語:OceanBase獨立分拆後的首次年度釋出,商業化成果是其最大的底氣

從V1.0版本走到V4.3版本,從分布式到一體化,從TP到HTAP再到SQL+NoSQL,OceanBase資料庫和架構持續朝著一體化的方向升級叠代。最新的V4.3版本則基於一體化產品,推出了全新的向量能力,實作SQL+AI的深度融合。

目前,OceanBase的業務不僅覆蓋了頭部政企、行業獨角獸,也兼顧了中小客戶。其公有雲服務已觸及全球範圍內100多個可用區,並且相容多家主流公有雲基礎設施。

OceanBase今年3月才從螞蟻集團中分拆出來,成為一家獨立營運的公司,這也意味著其背負了更大的財務壓力。從此次年度釋出會中可以看到,距離螞蟻集團組織架構改革已過去將近半年的時間,OceanBase不僅持續叠代升級其開源資料庫,還構建了在海內外市場的商業有利競爭。