證券之星訊息,2024年8月30日海天瑞聲(688787)釋出公告稱公司於2024年8月28日召開業績說明會,東吳證券黃詩濤、信達澳亞馬綺雯、大和住銀劉明、錦成盛資產王懿晨、庶達資產李淑花、長宜基金王勃、新華基金張帥、中郵電腦丁子惠、中信證券朱玨琦 韓林軒 許英博、華夏財富創投戴永毅、譽輝資本郝彪、國信證券閔曉平、建信養老高月、景泰利豐資產呂偉誌、景泰利豐投資鄒因素、錦繡中和投資方家逸參與。
具體內容如下:
問:公司上半年收入增長的主要驅動因素是什麽?
答:2024 年上半年,受益於多模態大模型的發展、【促進和規範數據跨境流動規定】出台帶來的政策環境改善以及公司在境外行銷體系的持續投入,公司境外業務收入同比增長 50.00%,拉動公司整體營業收入快速增長。
問:公司上半年凈利潤增長的原因是什麽?
答:公司在上半年收入增長的同時,由於標準化數據集產品收入占比大幅提升,同時公司整體數據交付能力在管理能力、平台技術提升、供應鏈進一步整合和擴充套件等因素的共同推動下,使訓練數據客製服務的毛利率也同比顯著增長,共同驅動公司整體毛利率增加至70.34%。同時,在研發投入方面,隨著先發募投計畫的結項,公司在傳統深度學習數據集建設等方向已達到階段性成熟狀態,整體研發投入強度呈現自然落;同時,在銷售及管理投入方面為進一步提升整體營運效率,公司進行了資源的合理配置和流程最佳化,使得銷售費用以及管理費用有效降低,以上因素共同驅動公司上半年凈利潤大幅增長,實作扭虧為盈。
問:公司在全球化業務增長的原因是什麽?
答:2024年上半年,受益於大模型技術的快速發展以及套用領域不斷拓展,以智慧終端廠商為代表的科技巨頭紛紛加大多模態數據投入,全球數據服務市場持續增長。在此背景下,公司憑借多年來在語言研究以及自然語言方面的技術積累、以及全球領先的標準化數據集儲備,進一步贏得了境外客戶信賴。與此同時,【促進和規範數據跨境流動規定】等法規出台,為數據出境提供了更為高效簡明的路徑。以上行業發展以及政策環境的改善,使得公司境外業務收入較上年同期顯著增長50.00%至 4,369.53萬元。
問:公司在大模型業務上有何布局和進展?
答:2024年上半年,公司繼續加大大模型數據方向的研發投入,增厚大模型領域的數據儲備,已完成並持續建設包括「大語言模型中文對話預訓練數據集」、「語音大模型(聲音復刻、歌曲)微調數據集」、「語音大模型(多語種)預訓練及微調數據集」、「視覺大模型(影像-文本)預訓練及微調數據集」、「視覺大模型(視訊-文本)預訓練及微調數據集」等在內的多領域大模型數據集。同時,針對大模型在特定行業的套用需求,公司重點開發了醫療、金融、法律、藝術等垂直領域的標註資源,形成垂直領域專家庫,為公司提供高品質行業數據服務奠定堅實基礎。與此同時,為更好理解大模型技術方向,公司透過前瞻性研究,探索大模型數據的規模化生產方式。公司已和清華大學聯合啟動多語種語音大模型研發計劃,該計畫將基於最新的語音大模型框架技術,自研多語種數據清洗技術,訓練多個不同規模的語音大模型,有效提升多語種語音數據處理的效率和準確性。
問:公司在智慧駕駛領域有哪些最新進展?
答:為更好搶抓智慧駕駛行業機遇,同時應對更為復雜的數據處理需求,2024年上半年,公司加大了對高級別數據標註工具的研發力度,截至6月底,DOTS-D平台新增 3D動靜分離標註工具,BEV多圖層 4D車道線標註工具,並升級點雲分割工具支持連續幀疊加標註和4D分段載入等核心能力,有效支撐了自動駕駛 BEV和 OCC主流演算法演進對數據標註工具的需求。此外,公司不斷最佳化演算法中台中樞能力,開發了 2D-3D 融合的動靜分離檢測追蹤演算法,在點雲連續幀融合產線實作提效 30%以上,叠代最佳化點雲分割演算法和地面檢測演算法,在點雲分割產線實作提效 20%以上。此外,為進一步支撐中國車企的國際化戰略,公司在全球範圍內擴充套件了道路采集業務,可提供包括采集方案設計、采集人員組織、車隊管理、車輛改裝及數據清洗與脫敏等在內的全鏈條服務。2024年上半年,公司采集業務已覆蓋包括德國、西班牙、捷克等多個國家,為公司構建智慧駕駛全球化數據服務能力奠定了基礎。
問:強化學習階段的數據服務,今年有何進展或者變化?
答:目前來看,隨著各大模型的陸續上線,強化學習環節的整體數據需求在逐漸攀升,並在具體標註任務上呈現如下趨勢
(1)由單模態向多模態轉變23年主要的標註需求集中在文本類標註,今年開始逐步向多模態拓展(例如,文本-視訊、文本-影像等);
(2)逐漸向更多垂類拓展(例如,法律、金融、醫療);
(3)強化學習標註的評價/評分指標變得更為豐富,會要求標註人員從更多維度對模型的問進行評判和打分。
問:請大模型向多模態發展後,是否會對公司業務產生正向影響?
答:大模型向多模態發展後,將會產生更多的新型數據需求。例如文生圖的多模態大模型,透過文字輸入生成對應圖片,這就需要機器理解文字語意的同時將理解的關鍵詞與圖片的關鍵標簽進行對映,透過對齊兩種獨立模態關鍵特征的方式,實作按指令的創作,以此完成學習訓練過程。因此,當大模型向多模態能力維度拓展時,高品質多模態訓練數據集的持續學習訓練的重要性將更加凸顯,多模態的發展將推動數據服務行業進入更大的增量空間。
海天瑞聲(688787)主營業務:AI訓練數據的研發設計、生產及銷售業務。
海天瑞聲2024年中報顯示,公司主營收入9242.64萬元,同比上升24.13%;歸母凈利潤41.64萬元,同比上升102.42%;扣非凈利潤-367.58萬元,同比上升84.09%;其中2024年第二季度,公司單季度主營收入5178.11萬元,同比上升13.45%;單季度歸母凈利潤105.06萬元,同比上升128.98%;單季度扣非凈利潤-102.95萬元,同比上升83.0%;負債率4.37%,投資收益291.14萬元,財務費用84.64萬元,毛利率70.34%。
該股最近90天內無機構評級。
以上內容為證券之星據公開資訊整理,由智慧演算法生成,不構成投資建議。