當前位置: 華文世界 > 科技

雙創青年向「新」而行|謝晨:我們要做數據領域的「輝達」

2024-05-10科技
「我們要做數據領域的‘輝達’,創出驅動未來的‘淘金鏟’。」當啟數光輪科技(上海)有限公司創始人謝晨決定「賣數據」時,如同在平靜湖面投下一顆石子,漣漪陣陣。
算力是把控人工智慧(AI)發展未來的第一步,而支撐算力的是豐沛的、有價值的數據。謝晨帶領團隊在國際領域創新,將AIGC(生成式人工智慧)與仿真技術深度融合,提供多模態、高品質、大規模、低成本的合成數據。
企業成立僅一年,「售賣」的數據解決了諸多業界難題,已獲四輪融資,更獲得頭部創投機構經緯中國、奇績創壇等的認可。「敢想、敢行動、敢挑戰最高峰,以青年力量加速中國人工智慧產業發展。」
五年驗證「一個真理」
20年前,在北京大學讀物理的謝晨不會想到,有朝一日專業也成了創業的敲門磚。
大學畢業後,謝晨赴海外攻讀數量金融博士。之後,在輝達負責自動駕駛仿真業務。當時,他發現要讓自動駕駛變得更安全,就需要大量的訓練數據,而這些真實數據不僅難以采集,而且存在利用率低、標註成本高和長尾場景缺乏等問題。
仿真模型是物理物件、系統或過程的虛擬表示,可預測其在不同場景中的行為和效能。在物理領域,研究者往往會用仿真的形式對復雜的系統和過程進行建模,但生成的數據真實度、泛化性與效率較低,無法解決現有難點。「能不能讓物理仿真與人工智慧相結合?」
結合自己所負責的自動駕駛業務,他開始驗證AIGC與仿真技術融合的可能性。他持續最佳化程式碼、調整關鍵效能參數,有效生成了大量數據。借助先進AI演算法,他對這些數據進行了深入細致的分析,逐一比對,以確立一套可量化的數據評估準則,從而找到符合計畫需求的數據,使其被有效利用。
此後,他先後在蔚來等企業擔任自動駕駛仿真負責人,繼續在實踐中「檢驗真理」。功夫不負有心人,五年的時間裏,經反復驗證,他終於找到了AIGC與仿真技術最佳融合方法,由此可以生成對映現實世界的合成數據——影像或視訊,透過訓練演算法理解和學習現有數據便可生成3D、物理真實、可泛化的新數據。
帶著自己確認的「真理」,謝晨在2023年毅然決然辭職創業。「物理是研究世界的底層邏輯,現在做合成數據,則是‘探聽’未來世界的秘密。」
打一個「復合式」修補程式
剛開始創業3個月,謝晨就成功完成「接單」。
有廠商反映,企業正在研制的自動駕駛有不少bug。比如,路邊廣告牌上有人物圖案時,汽車會將其辨識為真人,啟動剎車。廠商的演算法工程師直接給自動駕駛程式打「修補程式」,即修改辨識程式規則。「但一旦出現真的行人,又容易無法辨識,從而出現安全隱患。」
謝晨的團隊迅速開始提供數據服務,生成了數千個包含人像廣告的各類場景,並從中挑選出帶有精確標註的數據。這些數據隨後用於演算法訓練,以增強自動駕駛模型的表現。
第一單生意,就此「談成」,啟數光輪就此一炮打響。「我們提供以數據為中心的解決方案,讓企業以相對較低的成本實作高效率的數據叠代。」此後,謝晨搭建了國際領先的合成數據產線,為多家海內外知名自動駕駛公司、國內外主機廠提供產品交付並形成合作夥伴關系,今年以來已經簽約國內數個頭部主機廠,訂單金額數百萬。
「與其擁抱技術,不如保持開放態度去自我顛覆。」企業的研發也正高速運轉著。目前研發團隊正不斷完善核心技術,就在不久前,謝晨還帶領企業與上海人工智慧實驗室聯合推出並開源自動駕駛3D Occupancy合成數據集「LightwheelOcc」,用於CVPR 2024自動駕駛挑戰賽和China3DV 2024挑戰賽。據悉,今年下半年,企業的合成數據將實作3至5天內,與自動駕駛解決方案供應商或主機廠的模型「適配」,攻克相關難題。
這支由謝晨執帥的團隊,平均年齡28歲,技術人員占比超過90%,是合成數據、AIGC、仿真等領域技術大咖。能凝聚起這樣一批優秀青年,謝晨說,靠的是共同的目標——以數據為內核,挑戰未知的可能。
企業坐落於嘉定區,樓上是相關主機廠,樓下不遠處是嘉定沙哈霍德羅,所見之處都是創新機遇。「我們看好上海,上海也給了我們廣闊的舞台,我們一定能在此逐夢圓夢,向新而行。」
作者:占悅
文:占悅圖:受訪者供圖編輯:周辰責任編輯:劉力源
轉載此文請註明出處。