作者 | 徐豫
編輯 | 心緣
智東西10月25日報道,在10月23日舉行的OceanBase 2024年度釋出會上,OceanBase數據庫OceanBase 4.2.5 LTS、OceanBase 4.3.3正式釋出,OceanBase 4.4開啟內測,OceanBase雲數據庫即日起免費提供365天的試用期。而OceanBase首批分布式數據庫今年已透過中國資訊保安測評中心的「安全可靠測評」。
基於單機分布式一體化架構和AI技術,OceanBase數據庫大幅最佳化了可延伸性、實時分析、消除數據孤島、跨雲部署、多模態、向量搜尋、容災等方面的效能。
同時,有了專有雲和公有雲服務「雙引擎」加持,今年OceanBase的客戶數成功突破2000家,行業解決方案夥伴增速超100%,熱門解決方案落地增速超50%,核心經銷商夥伴業績占比超60%。
一、新版數據庫正式對外開放,強化即時數據處理水平
OceanBase CEO楊冰正式宣布推出OceanBase 4.2.5 LTS版本和OceanBase 4.3.3首個GA版本。
OceanBase 4.2.5 LTS版本相較於此前的4.2.1 LTS版本TP效能提升了26%,小規格4C TP效能則提升了37%,系統的處理能力得到較大提升。
同時,其融合了OBKV-HBase和OBKV-Redis兩個不同模態的數據庫,可以兼顧HBase的大規模數據儲存和處理優勢,以及Redis的快取和即時讀寫能力。
此外,據OceanBase CTO楊傳輝透露,該版本還可相容甲骨文的數據庫,使用者托管在甲骨文數據庫5.7版本的數據,可以不改程式碼平滑遷移至OceanBase 4.2.5 LTS版本的數據庫。
與4.3.0版本相比,OceanBase 4.3.3版本TPC-H 1T提升了64%,TPC-DS 1T提升了36%,寬表效能ClickBench hot-run提升了49%,還新增了向量檢索能力。
楊傳輝稱,該版本是面向即時AP場景的首個公開版本,相容特定的數據類別,支持快速匯入匯出,並且針對特定場景預設了AP參數樣版,免去了使用者重新補充參數的功夫。據楊冰透露,過去一年已有大約60個客戶試用該系列的小版本,並給出了不錯的使用反饋。
二、采取單機分布式一體化架構,兼具效能和成本優勢
對於數據庫而言,其采用集中式架構通常會在相容性、易用性、單機效能上較為突出,而選擇分布式架構則更多是在擴充套件性、可用性和成本上占優勢。
OceanBase的數據庫則依靠的是「單機分布式一體化」架構,既考慮到分布式架構的擴充套件性,又具備集中式的功能和單機效能,還能同時處理結構化和非結構化數據。
楊傳輝解釋道,這是因為OceanBase希望能用一個數據庫,去解決至少80%的數據問題,使數據庫變得普惠和通用。
從OceanBase多個實際客戶案例中可以看到,企業使用者選擇單機分布式一體化架構後,等同於只花費一個系統的錢,能獲得兩份甚至多分復合收益。
例如,山東移動此前用的是甲骨文數據庫,基礎設施基於傳統「IOE」架構,擴充套件能力受限,也難以應對高峰期流量和復雜查詢場景。其轉用OceanBase的數據庫後,計費系統效率提升了近30%,整體成本降低了9成。
同時,透過跨多數據中心分布式集群部署,山東移動的數據庫能達到機房級別的容災效果。
三、AI Agent的數據底座,可理解並執行復雜語意
OceanBase將其一體化數據庫視作AI時代的數據底座,旨在讓AI技術像數據庫一樣通用。目前,AI技術已滲透該公司數據庫的開發、運維、診斷等環節。
如果用不同的數據庫處理不同類別的數據,這通常存在研發成本高、傳輸過程復雜、查詢路徑繁瑣等弊端。楊傳輝稱,在通用數據庫中整合向量外掛程式後,OceanBase的所有底層能力都可以直接復用。
除此之外,OceanBase一體化數據庫還融入了LangChain、Llamaalndex、DB-GPT等主流AI技術棧。
現場楊傳輝用ANN Benchmarks基準測試驗證OceanBase一體化數據庫的向量效能。從測試結果來看,其向量引擎在準確率、速度等多維度上超過業界頭部水平。
在C端套用方面,OceanBase與螞蟻集團的生態建立了緊密結合。支小寶、螞小財、支付寶百寶箱Agent,以及包括AI健康管家在內的3個螞蟻集團AI管家,它們的數據底座都用的是OceanBase一體化數據庫和架構。
其中,支付寶百寶箱Agent是一個搭載了AI能力的小程式。該Agent可以讀懂復雜語意,為使用者檢索、篩選、推薦吃喝玩樂的店鋪。
楊冰稱,此類Agent背後需要涉及復雜的語意互動,過去通常依賴大量地理位置、向量的儲存來實作這一功能,產品開發周期也長。而得益於OceanBase一體化數據庫和架構,該平台僅由兩名開發者耗時一周的時間,便實作了從構思到產品的落地。
▲在支付寶百寶箱Agent的聊天框中輸入「推薦距離兩公裏以內,人均消費25元以下,評價4.5分以上,不用排隊的奶茶店」
四、公有雲和專有雲成為商業化雙引擎,超6成客戶為千億級規模
除了OceanBase一體化數據庫和架構,該公司的多雲服務也實作了全新升級。
OceanBase上新Free Trial入口,即開發者可以在一年內免費試用OceanBase雲數據庫,也能自由選擇所需的雲服務商。此外,OceanBase雲數據庫不久後將在阿裏雲精選市場中開放接入。
而OceanBase 4.4實驗室版本正式開啟內測,主推存算分離和共享儲存架構。
迄今為止,主流電腦的資源利用率大部份情況下只有個位數。OceanBase創始人兼首席科學家陽振坤建議,若想給客戶帶來「用一份硬件的錢買到了兩份硬件」的使用體驗,公有雲、專有雲、行業雲等多雲服務一方面可以透過資源池化和復用來降低成本,另一方面可以透過動態伸縮和按需使用提升效率。
據楊傳輝透露,OceanBase雲數據庫已經在公有雲上實作基於物件儲存的存算分離,並且用起來「性價比高」。
經過4年的商業化摸索,OceanBase今年客戶數突破2000家,連續4年增速超100%,並且中小客戶占比相較於去年進一步擴大至80%。
當前,該公司形成了「雙引擎」的商業發展模式,主要增長動力來自專有雲服務。從2022年到2024年,其專有雲客戶數增速達到50%,包括中國南方航空等航空公司,北京、西安等多地地鐵營運商,匯豐銀行、交通銀行等金融單位。
而同期其公有雲客戶數增速為130%,成為OceanBase的第二增長引擎。其客戶集中於零售、智能制造、互聯網金融行業,包括小米、科大訊飛、Vivo等高增長公司和行業獨角獸。
楊冰稱,超千億交易規模的支付企業和超千億規模的消費電子企業均超6成在使用OceanBase公有雲服務。
兩年前,OceanBase曾在當時的年度釋出會上宣布了其「珊瑚計劃」,旨在構建一個以合作夥伴為中心的商業生態模式。該計劃的核心目標是在未來3年內與60家核心經銷商達成合作,並且合作夥伴的收入占比達到60%以上。
從今年的戰果來看,該公司超前完成了這一目標。現在OceanBase累計有超150家核心經銷商,簽約占比達70%,業績占比超過6成。未來該公司將持續下沈二線、三線、四線城市,並計劃在出海市場中尋求新的增長動力。
五、無論是金融還是出行產品,都需要一個國產的、更安全的數據庫
OceanBase的生態合作夥伴覆蓋了金融、政務、交通、能源、科技、公共服務等多個領域。在【共話雲和AI時代的數據庫】的圓桌論壇上,部份生態合作夥伴分享了他們對於OceanBase新版數據庫的第一感受。
據IDC中國副總裁兼首席分析師武連峰透露,雖然全球已有17%的企業把生成式AI技術套用到企業生產的過程中,但實際上只有11%左右的企業真正落地了「DateBase for AI」,或者「AI for DateBase」,主要是因為準確率達不到95%的標準。
中國人保財險科技營運部副總經理張帆稱,單庫40個TB的數據處理是基操,數據庫的安全性和穩定性也愈發重要,因此保險行業未來更需要一個國產化的、多模的、支持多雲的、可靠的、具有AI能力的數據庫產品。
T3出行數據庫負責人高建豐認為,數碼化出行的排程過程需要大量即時數據來支撐。因此,一個實時分析能力強,並且可以節省人力、物力、研發資源,低成本可用的數據庫產品,在他看來是一種更好的技術解決方案。
中國聯合航空有限公司資訊中心總經理馮振宇則將數據庫和AI的關系,比作「好馬配好鞍」。在他看來,OceanBase數據庫的新版本、新產品可以將原有的系統原封不動地整合到新的平台下,能夠把現有的資產盤活,變成真正的數碼資產,已經稱得上是「好馬」。
同時,OceanBase結合AI技術,為其架構推出全新的向量搜尋能力。馮振宇認為,這不僅拓寬了圖片等數據資產的範圍,也使AI初具「馬鞍」的雛形。
六、AI時代的新風口,「讓數據好用,把數據用好」
錢衛寧是華東師範大學數據學院院長和CCF數據庫專委會常委。此次OceanBase 2024年度釋出會上,他也受邀分享了自己在數據庫領域,從學生身份轉變到導師身份這一過程中的觀察。
他認為AI行業中的核心變化是數據智能的變化。從某種程度上來說,「互聯網企業是最早的AI企業,」錢衛寧解釋道,人們很早就開始嘗試把手頭上的事情交給機器去做,這也意味著人們逐步建立起對底層數據庫的信任。
隨著互聯網行業不斷重構各行各業,該行業內逐步孵化出了數碼化這一概念。數據可視作一種「新能源」,如何在新的AI時代中將其真正大眾化,將其變得「唾手可得」。在錢衛寧看來,這是對數據庫廠商的關鍵考驗。
目前,基本上每個大型企業都部署了專用的數據庫。然而,同時線上使用數據庫的使用者在數量和使用方式上都愈發不可控,原本單機形式的數據庫已經不足以滿足使用者需求,也因此催生了分布式數據技術和分布式數據庫,讓企業能夠以更低的成本來管理好數據。
分布並列數據庫、雲原生數據庫和開源數據庫是未來數據庫的三大衍生方向。錢衛寧稱,「現在是中國數據庫最好的時代」,而類似於OceanBase的做法,去整合、協同不同垂直領域的數據庫,則是新的機遇。
結語:OceanBase獨立分拆後的首次年度釋出,商業化成果是其最大的底氣
從V1.0版本走到V4.3版本,從分布式到一體化,從TP到HTAP再到SQL+NoSQL,OceanBase數據庫和架構持續朝著一體化的方向升級叠代。最新的V4.3版本則基於一體化產品,推出了全新的向量能力,實作SQL+AI的深度融合。
目前,OceanBase的業務不僅覆蓋了頭部政企、行業獨角獸,也兼顧了中小客戶。其公有雲服務已觸及全球範圍內100多個可用區,並且相容多家主流公有雲基礎設施。
OceanBase今年3月才從螞蟻集團中分拆出來,成為一家獨立營運的公司,這也意味著其背負了更大的財務壓力。從此次年度釋出會中可以看到,距離螞蟻集團組織架構改革已過去將近半年的時間,OceanBase不僅持續叠代升級其開源數據庫,還構建了在海內外市場的商業有利競爭。