當前位置: 華文世界 > 科技

AI競賽千帆齊發,趣丸科技如何贏下「巨頭之戰」?

2024-07-18科技

7月,上海世界人工智能大會( WAIC )上人頭攢動,各家公司各顯神通,各式各樣的機器人、虛擬人與AI生成的圖片、影片與音訊一起,組成一幅光怪陸離的畫面,不禁令人遐想,AI對人類社會大規模改造的時代是否已經近在眼前。

與往年不同的是,今年的WAIC擁有了首支AI原創主題曲——【WAIC 正青春】,展現了人工智能在藝術創作領域的可能性。

生成式AI是今年最熱門的科技話題之一——先是文生音樂工具Suno火爆,讓許多人感嘆「音樂界的ChatGPT」已經降臨;緊跟著是OpenAI推出能打造音樂MV的Sora,國內的科技公司,如快手和字節等,也相繼推出了自己的影片生成大模型和AI音樂工具。

人工智能,有再造字節或拼多多的機會嗎?

相比往年,今年WAIC的特色在於,從業者們不再囿於對基礎大模型的討論,而是出現了更多面向垂直場景的套用端產品。這代表著技術研發人員的思路已經越來越清晰,AI也越來越接近普通人的生活。

從2022年底ChatGPT釋出至今,也不過短短一年半而已。趣丸科技副總裁兼首席戰略官莊明浩記得,一年前大家的討論還局限在AI在語言和文本的套用,但如今,圖片、影片、音訊、音樂等等多模態板塊爆款頻出,也證明了新浪潮的生命力。

在這千帆競逐的AI浪潮之中,無論是初創公司還是中小型公司,都再一次獲得了與巨頭公司同台競技的機會——就像十多年前流動互聯網創造的那方擂台一樣。

莊明浩用「AI對創業者是暗牌,對大廠是明牌」這句話來概括如今的混戰局面。

所謂「對大廠是明牌」,指的是對所有大廠來說,在今天做AI都是題中之義,是賦能現有業務必須要做,也有計劃有節奏去做的事情;而「對創業者是暗牌」,指的則是對創業公司來說,要判斷AI的創業方向,則是要靠猜、靠揣摩的事情。

但是,新一代巨頭往往隱藏在打暗牌的機會之中。「2010年,大公司都在對業務做無線改造的時候,沒有人會想到幾年後會出現拼多多、抖音這樣的公司。」莊明浩說。「只有明牌不成牌局,有了森林才會有參天大樹,有了復雜的生態才會有出色的公司」。

十年前,趣丸科技抓住了那張「暗牌」,推出了TT語音,打破了移動語音市場的空白。十年後,在新一輪明牌與暗牌交錯時刻,趣丸科技為什麽擁有坐上牌桌的資格?莊明浩給出了三點原因。

首先,是趣丸在泛娛樂等垂直領域已經深耕十年,對這個場景的生態和使用者有深度理解。「我們這些做業務的公司,本質上來講,都是為了滿足使用者場景去做的,滿足使用者訴求,始終貼近使用者需求,就是創業公司和業務公司一直以來的使命。」莊明浩說。

其次,是在垂直模型的研發上,趣丸長期投入自研的技術積累以及「人無我有」的高質素數據積累。在AI領域,數據的重要性遠高於模型,而擁有獨有數據的企業將更具有利競爭。

最後,趣丸擁有高黏性、高活躍的試驗場景。如前文所說,因為擁有受歡迎的紮實產品,趣丸的創新性技術得以快速走出實驗室,接受使用者和市場的檢驗和打磨,盡早進入「研發—提效—增收」的正向發展迴圈。

先成為專才,在擅長的領域找新機會

2011年流動互聯網興起之際,著名風投公司合夥人約翰·杜爾提出了「SoLoMo」概念,即Social(社交)、Local(本地化)和Mobile(移動)。這一概念提出時,被很多人公認為是互聯網未來發展趨勢,成為了指引很多公司前進的標準答案。

回歸到當下這個時間節點,AI仍處於發展的早期階段,那個大家期待的標準答案仍未出現。無論是大廠還是初創公司,都不斷在嘗試和探索、取舍和博弈,很多東西都是模糊態的混亂的。但對於有些公司而言,這種「混亂」不是深淵,恰恰是階梯。

相比於大廠「卷」通用大模型和大客戶,趣丸科技更像是一個擁有「通才思維的專才」,其更擅長在垂直場景中解決難題與找新路徑。這是趣丸與生俱來的優勢和底氣,且早已證明過自己的能力。

「現在快速演進的行業狀態以及基礎大模型能力的迅速叠代,給做工程端、套用端的公司帶來了挑戰。」莊明浩說,這導致基於大模型來塑造產品的公司常常被「拖著走」,往往是自己剛改好,底層模型又變更,很難保證服務的穩定性。

趣丸科技的做法是基於自己深耕的語音和泛娛樂場景,去自研垂直「小」模型,自己做訓練,並形成了「產模並列」的發展路徑。「在這個領域裏面,我們能夠保證這個模型是相對穩定的,不會特別受到底層通用大模型的迅速叠代帶來的沖擊。」莊明浩說。

截止目前,趣丸科技自研的垂直大模型已覆蓋音訊、音樂、對話等領域,在多模態理解、生成、互動上更專精更好用。在此前釋出的【2024中國人工智能行業大模型企業競爭力100強研究報告】中,趣丸大模型也躋身100強行列。

比如,在AI音樂領域,趣丸科技自研出了全球範圍內首個多模態配樂大模型,具備文生音樂、音訊生音樂,甚至是影片生音樂的能力,支持AI作詞,自動作曲、編曲、混音等,能夠一站式解決使用者音樂創作全流程難題,讓普通音樂愛好者真正實作零門檻創作音樂。

AI音樂,是一個沒有標準答案的新賽道。當「音樂界的 ChatGPT」Suno橫空出世,全世界的註意力都投到這個小版塊上時,趣丸科技已經耕耘了多年。可以說,趣丸科技也是業界最早開發音樂大模型和AI原生套用產品的企業之一。

此外,基於自研的生成式動作大模型和音訊大模型等技術,趣丸科技開拓出了數智人、多語言轉譯等一站式的企業級解決方案。除了服務於其產業鏈上下遊的遊戲廠商、MCN機構的影片內容創作、出海等業務,還被套用於智能客服、本地生活、影視文旅等場景,輻射了萬億級市場規模,合作夥伴包括中國電信等知名企業。

幾乎所有的大產品,都是起於垂直人群,然後不斷泛化最終變成國民級產品。而AI將結構性地改變使用者體驗和產業生態,垂直套用場景孕育的廣泛商機不言而喻。

AI的「平權化」,讓大家擁有站在同一起跑線上的資格。但對於創業公司來說,在垂直行業裏做到「產模並列」的這一趣丸路徑,或特許以借鑒但無法硬搬,畢竟數據和行業know-how積累是關鍵,積累得越久壁壘也就越高。

用「簡單公式」抓住確定性之錨

AI時代大浪淘沙,企業如何在不確定中抓住確定性?莊明浩認為,決定成敗的始終是一句「正確的廢話」,那就是「貼近使用者需求」。

「我們一直以來的使命,就是透過創新的技術和產品,來解決使用者一直以來沒有被滿足的需求。」莊明浩說。無論技術怎麽更叠,資本環境怎麽變化,做X+AI還是AI Native,這個底層的邏輯永遠不會改變。

從自研垂直大模型,到構建起全棧式AI互動技術產業生態。趣丸科技始終堅持從使用者需求出發,優先選擇典型的垂直場景作為試點進行突破,試點成功之後再將成功經驗復制到其他場景,由此降低AI轉型中的不確定性。透過種種的「多做一點」,實作了讓使用者與客戶的「穩定一點」和「好用一點」。用這種一步一個腳印的「笨辦法」,逐漸得出了一生二、二生三的「簡單公式」。

與此同時,面對看上去是無所不能的AI,趣丸科技也強調使用的「邊界感」。這個邊界既包括AI與業務場景的融合的邊界定義,也包括對現階段AI能夠做到什麽技術程度的邊界理解。

「今年的WAIC大會,讓我回想起十幾年前參與流動互聯網大會時的感受。」莊明浩說。當年北京鳥巢旁巨大展廳裏的氣氛,與如今WAIC在上海引發萬人空巷的狀態如出一轍。

面對更加殘酷的競爭環境,趣丸科技已在垂直領域率先建立一定的壁壘和優勢,優先拿到跟上AI時代大浪潮的船票。明年AI行業的先行者們會帶來什麽新東西呢?企業如何儲備更多的「彈藥」?

莊明浩相信,AI行業在一兩年之內就會迎來見證勝負的時刻。而現在,我們就像行走在黑暗森林裏,你在森林的某一處燃起火把,只能照亮旁邊的範圍,但慢慢走下去就會看到有一些地方有微弱的光,發現更多的同類,直到把這些光連在一起,共同迎來一個嶄新的世界。