當前位置: 華文世界 > 科技

AI大模型「賣鏟人」去年勁賺7.5億美元,成功模式難復制

2024-02-07科技

來源:創業資本匯

在AI大模型初創企業普遍還處於入不敷出、瘋狂燒錢的階段時,一家專註於AI數據服務的初創企業已經賺得盆滿缽滿,成為收入最高的AI創業公司之一。

據外媒近日報道,總部位於舊金山的美國初創企業Scale AI 2023年年化收入達到7.5億美元,為前一年的3倍。得益於AI大模型的發展,Scale AI的業績收入也如同坐上了「火箭」,一躍成為收入可以與OpenAI比肩的AI創企之一。不過,與直接提供大模型服務的OpenAI不同,Scale AI主要從事AI訓練數據標註服務,是大模型時代的「賣鏟人」。正如為大模型提供算力支持的輝達備受資本追捧一樣,提供數據支撐的Scale AI也得到了投資人的青睞。目前,Scale AI的估值已達到73億美元(約526億元人民幣),成為AI數據標註領域遙遙領先的獨角獸。

在最洋氣的行業幹最接地氣的活兒

公開資料顯示,Scale AI成立於2016年,主要為人工智能訓練提供數據服務,創始人為華裔青年Alexandr Wang。據媒體報道,Alexandr Wang的父母均為物理學家。他從小就表現出了傑出的數理天賦與才能,曾被麻省理工大學錄取,但在出色地完成第一年學業後便選擇了輟學創業,與Lucy Guo共同創辦了Scale AI。

值得註意的是,Scale AI創業初期就得到了創業孵化公司Y Combinator的支持。彼時,Y Combinator的總裁為山姆·柯曼,也即OpenAI的聯合創始人及現任行政總裁。

Scale AI主要從事的AI訓練數據標註,通俗理解,就是透過分類、畫框、標註、註釋等對圖片、語音、文本、影片等原始的數據進行處理,標記物件的特征,以作為機器學習基礎素材。比如,如果要訓練AI辨識出圖片中的狗,則需要采集大量有關於狗的圖片,將其中的關鍵資訊標註出來,供AI辨識,在多次辨識的過程中讓AI形成辨識各式各樣的狗的能力。

與高級、洋氣、科技感滿滿的AI大模型相比,數據標註工作一直被視為「臟活兒」和「累活兒」,被貼上「勞動密集型產業」的標簽。所以,Scale AI也被外界評價為「在最洋氣的行業幹著最接地氣的活兒」。正因如此,Scale AI的成功一直存在爭議,曾有業內人士犀利指出,「Scale AI不是一家AI創企,它只是一家提供廉價勞動力的公司」。

事實上,由於數據標註對於人工有大量的需求,而美國的人力成本十分高昂,Scale AI在東南亞、非洲等地區設立了一些外包機構,培訓大量的數據標註員。據媒體此前報道,Scale AI的外包公司Remotasks支付給標註員的薪酬很低,位於肯雅的標註員薪酬只有每小時1到3美元。

不過,作為驅動人工智能大模型發展的三駕馬車之一,高質素標註數據是訓練深度學習演算法的「燃料」。在大模型持續叠代前進演化的帶動下,大模型廠商對於高質素標註數據有著持續、強烈的需求,帶動Scale AI的業績不斷提升。PayPal聯合創始人彼得·泰爾也是Scale AI的投資人,他曾高度評價Scale AI:「在激烈的競爭中,AI公司們會出現又消失,但是Scale會一直存在。因為Scale AI提供的是整個AI/ML(人工智能/機器學習)行業的基礎設施,數據是這個行業最重要的東西。」

記者梳理發現,Scale AI從創立至今,融資過程可謂順風順水,而且融資金額節節攀升。創辦伊始,Y Combinator向其提供了12萬美元的投資;2017年,獲得了450萬美元的A輪融資;2018年,成功完成1800萬美元的B輪融資;2019年,再獲1億美元C輪融資;2021年1月,完成1.5億美元D輪融資;同年4月,順利完成3.25億美元E輪融資。至此,Scale AI用5年的時間將估值水平提升至73億美元的水平,成為AI數據標註領域的獨角獸。

Scale AI的客戶群也很龐大,除了有Meta、OpenAI、微軟等科技巨頭外,Alphabet的自動駕駛汽車公司Waymo、通用汽車的Cruise、豐田汽車Toyota、Uber都是Scale AI的客戶。

難以復制的「Scale AI式成功」

Scale AI的成功,一直讓國內的AI數據標註企業頗為眼紅。由於AI數據標註本質上是人力「內卷」的生意,人工越便宜,接到的訂單就越多。很長一段時間以來,國內AI數據服務商都難以擺脫「行業內卷」和「價格戰」的困境,這一領域的初創企業生存境況普遍比較艱難。

一名業內人士分析,中國的AI數據標註行業主要有兩種形態:一種是科技大廠自建數據標註團隊,直接使用自身掌握的數據進行標註;另外一種就是專門的數據標註服務商,這些服務商大多數都是中小公司,承接大公司的標註任務。據介紹,由於自建團隊更能保證數據安全,科技大廠的核心數據基本使用自建團隊來標註,而邊緣數據則交給第三方處理。

「科技大廠依托自身的數據優勢,往往更青睞自建團隊。剩下的那些零星需求,只夠養活一些小公司,還不足以支撐起一個規上企業。」該業內人士表示。

除此以外,美國由於人力成本高,除了在海外設立外包公司提供相對低廉的數據標註服務以外,還需要透過技術方式解決數據生產問題。近年來,Scale AI就一直致力於提高數據標註的效率,公司研發的自動標註工具能夠透過演算法自動標記影像和文本數據,大大減少了人工標記的時間和工作量。雖然透過初篩的圖片和文本數據還要經過人工二次篩查和標註,但這種人機配合的方式大大提高了標記效率。

相比而言,中國依托人口紅利,人力資源獲取極為便利,人力成本也比美國要低得多,數據服務商並沒有很強的動力去發展相關的技術。曾有第三方數據服務商向記者表示,在許多標註專案中,甲方所提供的數據標註工具往往不夠完善,降低了標註的效率與質素。於是,公司便幹脆用線下的標註工具,透過增加人手等方式保證專案的完成。雖然短期是完成了專案,但技術並未得到積累,如此迴圈,以低價取勝的「堆人力」模式便難以破除。

事實上,早在去年大模型風口剛起時,一些數據標註初創企業就進入了投資人的視野,獲得了融資。但記者梳理發現,與像Scale AI這樣的行業獨角獸相比,國內數據服務初創企業所獲投資額相對較少,也還沒有形成比較強的盈利能力。曾有一名國內的數據標註企業負責人公開表示,公司與Scale AI「在業務模式、團隊背景上均存在不少相似之處,但大洋兩岸的企業服務環境和投資人特點存在差異,使得國內數據標註難以突破。」

在多種因素的影響下,Scale AI的成功目前在中國還難以復制。不過,隨著大模型的快速發展與變化,未來中國能否跑出能跟Scale AI媲美的數據標註獨角獸,答案依然值得期待。

責編:朱雨蒙

校對:李淩鋒

@5000+家上市公司:這份調查問卷,證券時報誠邀您參加!

展望2024年,上市公司發展預期如何?生產與經營的信心怎樣?面臨哪些主要的困難和問題?為了解以上這些問題,證券時報特別設計了【上市公司2024年發展預期調查問卷】,邀請您真實反映公司的經營情況,積極建言獻策。

長按圖片掃碼,即可填寫問卷↓↓↓

版權聲明

證券時報各平台所有原創內容,未經書面授權,任何單位及個人不得轉載。我社保留追究相關行為主體法律責任的權利。

轉載與合作可聯系證券時報小助理,微信ID:SecuritiesTimes

END

點選關鍵字可檢視

潛望系列深度報道丨 股事會專欄丨 投資小紅書丨 e公司調查丨時報會客廳丨十大明星私募訪談丨火速響應監管要求!券商、公募紛紛行動:暫停!丨北京樓市,最新調整!丨超160股漲停,近4000股飄紅!丨證監會召開重磅會議!丨證監會:暫停新增轉融券!存量逐步了結 丨中央匯金出手、證監會發聲!丨梅西爽約,主辦方撤回1600萬港元資助申請!球迷高喊「退錢」 丨多家A股公司回應質押風險:「屬正常合理水平」 丨證監會公布一批惡意做空案例!丨剛剛!證監會再發聲