當前位置: 華文世界 > 科技

人工智能行業套用專題:Glow、CharacterAI開啟AItoC想象空間

2024-10-20科技

【核心觀點:】

多模態能讓互動體驗升級,促使「數碼人」變成「數智人」。拿單模態裏情感陪伴聊天機器人Glow這種「數碼人」來說,它已經能和真人進行個人化、擬人化、智能化的聊天互動了,不過互動的方式就只限於文本和語音。以後,多模態模型要是發展起來,虛擬人或者機器人的互動方式也許能擴充套件到圖片、音樂甚至影片上,並且會用更接近真人的邏輯、理解和表達能力來交流、反饋,這樣就能提高虛擬人在電商、直播、教育、客服、社交、文旅導覽這些領域的互動體驗了。

1.1.2、Glow能給予情感陪伴體驗,還能輔助進行虛構情景聯想。

1)互動物件多種多樣,能給人差異化、多樣化、個人化的聊天感受。使用者既能跟自己建立的個人化智能體聊天互動,也能和平台裏其他使用者建立的智能體互動。使用者還能給別的使用者建立的智能體補充專門的設定,使這個智能體滿足自己的個人化要求。據了解,平台裏有部份智能體已經和差不多6萬個使用者互動過了。2)現在互動的方式就只有文字和語音這兩種。經體驗發現,目前在Glow裏智能體還不能反饋圖片內容,不過從對話內容判斷,隨著產品的不斷改進,圖片內容也許會在以後的版本裏加入。另外,使用者也能夠切換智能體的反饋形式,按照自己的喜好來推進聊天行程。

我們覺得,跟微信、探探、ChatGPT之類的聊天軟件比起來,Glow或許能在一定程度上更好地滿足使用者情感陪伴和奇幻情景聯想的需求,這樣就能讓使用者更願意用它。在情感陪伴這一塊:Glow的智能體可以馬上回應,性格各種各樣。ChatGPT工具性比較強,Glow跟它比起來,能給出個性更突出的回復,在一定程度上能滿足使用者傾訴、想要得到情緒回應甚至是獵奇的需求。而且和微信、探探這些真人社交軟件比,使用者用Glow的時候,不用擔心自己宣泄情感會給對方帶來負擔,也不用擔心影響自己的真實形象。在奇幻情景聯想這方面:從體驗來看,Glow能在一定程度上滿足使用者對虛構人物、虛構場景的幻想。在智能體設定上,可以設成歷史名人、影視文學作品裏的人物、動物或者虛構生物;在虛構場景方面,使用者話題能設定在各個朝代、鬼屋或者影視文學作品裏等等。像微信、探探這種基於真人社交的軟件,在這方面的體驗就比較少。

1.1.3、Glow是MiniMax公司開發的。MiniMax是個小而美的高科技公司,它支持產品叠代、變現。

Glow的技術支持是由開發公司MiniMax來提供的,主要包括三大模態的基礎模型架構、「User - in - the - Loop」使用者反饋機制和優秀的技術人員配置這幾個核心部份。1)掌握自己研發的三大模態基礎模型架構。MiniMax就是北京稀宇科技有限公司,這是一家2021年成立的人工智能創業公司。它直接從底層模型入手,基於Transformer架構,自己研究出了從文本到視覺、從文本到語音、從文本到文本這三大模態的基礎模型架構,在國內算是比較早同時具備3個模態大模型能力的創業公司了。模型開發投入相對來說比較好控制。技術合夥人楊斌說,文本、語言、視覺這三模態差不多是所有數碼內容的基礎形態,只要有一個規模比較小的團隊,一起維護最佳化這三個大模型,做好使用者閉環,就能有比較好的內容生成能力。甲子光年訊息稱,MiniMax現在團隊人數大概是100人。

2)使用者反饋機制能讓產品體驗更好。Glow按照「User - in - the - Loop」來人為最佳化產品輸出結果。在和智能體聊天的時候,使用者要是覺得智能體的回答好就可以「點贊」,不好就給「差評」,要是覺得回答「有趣」或者「邏輯不通」也能反饋。這麽一來,模型就能更清楚使用者在對話裏喜歡啥樣的回答,產品體驗也就最佳化了。這種機制和ChatGPT的基於人類反饋的強化學習機制(Reinforcement Learning from Human Feedback,RLHF)差不多。就是大語言模型(LLM)收到提示符後會給出好幾個回答,然後人對這些回答做評估、排個順序,在獎勵模型(Reward Model)裏按照回答質素高低給不同的獎勵,再把獎勵結果反饋給LLM,LLM就根據這個來強化學習,把下一輪的結果輸出最佳化一下。

3)公司的核心技術成員大多有著豐富的產業或者學術界經驗。根據甲子光年的訊息,MiniMax的核心技術人員都來自全球有名的高校以及全球知名的科技公司,在自然語言處理、語音、電腦視覺、電腦圖形學等業界或者學術界方面經驗比較豐富,差不多33%的成員有世界著名技術實驗室的博士學位,還有上百個全球發明專利。像聯合創始人閆俊傑是中科院自動化所的博士,他在深度學習和電腦視覺領域發表的論文被Google Scholar參照超過1萬次,並且在商湯的時候負責搭建深度學習的底層演算法以及人臉辨識等技術體系。

【第二章:重點企業分析】

2.1、中文線上:ChatGPT、文心一言這類產品能提升互動體驗。

新華智雲是新華網和阿裏巴巴組建的合資企業。新華智雲科技有限公司重點在媒體人工智能領域布局,它有一些核心產品,像2017年12月推出的媒體人工智能平台「媒體大腦」,這個平台開始在媒體領域嘗試機器生產內容(MGC);還有2018年6月推出的短影片智能生產平台「媒體大腦·MAGIC」,這個平台進一步促使人工智能技術在媒體、文旅、金融等領域朝著整合化、產品化、商業化去套用。它有一些落地的例子,比如2018年兩會期間,15秒就釋出了關於會議的MGC影片新聞,在俄羅斯世界杯的時候制作了賽事播報影片。

2.4、藍色光標:文心一言將會接入虛擬人。

2.5、捷成股份有個參股公司叫世優科技,世優科技旗下的數碼人已經接入ChatGPT了,有不少套用場景呢。

旗下的「MetaSurfing - 元享智能雲平台」連入了ChatGPT,還被引入到TikTok直播場景裏。公司的虛擬人制作SaaS平台「MetaSurfing - 元享智能雲平台」,重點是為了達成元宇宙裏人貨場「批次、短周期、低成本」的制作,已經用在Tik Tok跨境電商直播、虛擬主播直播互動這些場景了。公司也正在申請接入GPT - 4。1)形象制作:顧客靠著關鍵詞和描述,就能馬上生成適合直播和內容創作的虛擬形象。2)直播互動:這個平台已經接入ChatGPT之類的智能機器模型,輸入商品關鍵詞描述後,在選好的直播平台上,用選定的語言,按一下鍵就能完成724小時無人值守的直播。

2.7、湯姆貓:把核心的「湯姆貓」IP和GPT能力相結合,開發親子互動的產品。

2.8、奧飛娛樂:有名的IP要升級成虛擬偶像,它還參股布局對話機器人呢,這對話機器人能用於教育場景。

【報告節選:】

(這篇文章只是用來參考的,不代表我們的任何投資方面的建議。要是想使用相關的資訊,那就去看報告的原文吧。)

精選報告來源:【未來智庫】「連結」