在科幻電影【超能陸戰隊】中,「大白」(Baymax)作為一個友伴式療愈機器人,展現了高度的適應力和情感理解能力。他不僅能夠根據患者的身體狀況提供個人化的治療方案,還能透過辨識患者的情感狀態和身份調整語氣和行為,給予人類足夠情感支持。
圖 1:受到觀眾喜愛的療愈機器人——「大白」
「大白」代表了人類對未來AI的完美設想:智能、高效且富有同理心。這樣的「夢中情 AI」究竟離我們有多遠?7 月 31 日,SoundAI 聲智 AI 媒體溝通會在聲學未來館舉辦,答案似乎正在變得更加清晰。
本次活動以「大模型·新互動」為主題,聲智科技副總裁黃赟賀公布了AzeroGPT 的演算法技術升級成果,並釋出了兩款新品——AI 互動新品「千面智語」和AI 硬件新品「聲智珍珠耳夾式耳機」。
圖 2: 「大模型·新互動」聲智科技 AI 媒體溝通會
中國人自己的GPT-4o,給 GPT 加上「耳朵」
目前的智能體雖然已經能夠理解復雜的指令,能透過文字辨識基本的情緒,並能以文字的形式進行自然對話,或者用合成語音進行播報,但對人類復雜情感的捕捉仍不夠精準,看起來不夠「智能」。
聲智科技在此次媒體溝通會上展示了AzeroGPT搭載的語音模型的演算法升級,在與AI進行互動時,它就像裝上了「耳朵」一樣,能迅速、準確地「聽懂」使用者的意圖和需求,並且以語音對話的方式,進行更快地響應,還能夠透過聲音傳遞出不同的情緒和情感。對標 GPT-4o,讓 AI 在對話中表現得像人類一樣絲滑。
圖 3:搭載 AzeroGPT 的小易能夠迅速、準確地「聽懂」使用者的意圖和需求
該模型已經透過國家網信辦演算法備案和北京市生成式人工智能服務備案,在數據處理、私密保護、技術的安全性和穩定性等方面獲得了認可。並已成功落地套用於三甲醫院智能導診系統、機關單位智能助理、國家 5A 級景區、科技展廳智能講解、電訊供應商智能客服、大型樓宇智能電梯、公安反詐智能外呼系統等,積累了豐富的技術和服務經驗,得到了客戶和使用者的認可。
圖 4:聲智已經順利完成「聲智壹元大模型演算法」「Azero高級語音辨識演算法」「Azero高級語音合成演算法」三項深度合成服務演算法備案,以及一項「聲智壹元大模型」生成式人工智能服務備案。
超低成本部署,打造 AI 硬件與 AI 互動產業生態
傳統聲學模型在嘈雜環境中的表現往往不盡如人意,尤其是在重疊語音、多人說話等場景下,語音辨識的準確率和響應速度都會被限制住。
聲智科技在本次媒體溝通會中展示了大模型在各種聲學環境下無縫交流的流暢體驗,透過對AI演算法的升級以及Azero開發框架的最佳化,顯著提升了聲學模型雲端運算的速度和準確性。
此外,本次升級還將降噪演算法、聲紋辨識等聲學演算法成功轉移到雲端運算,這一轉變打破了傳統器材端部署的局限性,提升了計算效率和安全性,還有效降低了AI器材的成本。
雲端運算的部署方式可以讓大模型接入各種硬件器材和互動軟件,使用者可以透過各種接入大模型的終端器材召喚屬於自己的全能 AI 夥伴。聲智面向不同的行業使用者,已經開放了安全的私有化部署、可信的行業化訓練,以及專業的生成式推理解決方案,打造人機互動產業生態升級,助力企業進行全域智能升級。
圖 5:搭載 AzeroGPT 的智能可穿戴硬件——聲智珍珠耳夾式耳機在百元級耳機上實作了同聲聽譯、語音轉寫、智能寫作等 AI 功能
此外,AzeroGPT 擁有超高級別的數據安全和私密保護措施,透過了全球公認的資訊保安管理標準——ISO27001 認證,還透過了多個行業內公認的技術安全認證,如CCRC 資訊保安服務資質認證、資訊科技服務管理體系認證、資訊保安管理體系認證和資訊科技服務標準認證等。聲紋辨識技術及器材也透過了透過公安部特許認證。這些認證不僅是對聲智技術和管理能力的認可,更是證明了 AzeroGPT 已經具備了高水平的技術能力和管理體系,能夠提供穩定可靠的服務,減少因系統問題導致的業務中斷風險。
圖 6: 聲智壹元大模型 AzeroGPT 已經透過多項備案。
「千面智語」——更通人性的互動智能體
實作「千人千面」的個人化服務一直是AI發展的重要方向。聲智科技的新產品「千面智語」數碼人互動服務,基於大模型和語音互動框架,能夠根據不同使用者的偏好和需求調整回應方式。
圖 7: 聲智AI 互動智能體新品「千面智語」釋出
媒體溝通會現場為觀眾展示了即時的擬人化交流效果。面對兒童的提問,Azero GPT 的回答會充滿童趣和簡單易懂的解釋,就像一個童年玩伴一樣滿足少年兒童探索未知的好奇心;而與老年人交流時,會采用較慢的語速和更貼心的表達方式,輔助老年人進行理解,充分展示了老年人。此外,媒體溝通會上還展示了心理醫生、反詐警官、稅務客服等角色,可以看到AI 在不同身份下都能進行符合該角色風格的表達,風格迥異的回答內容和聲音語氣,可以讓機器人擁有足夠的專屬感和陪伴感,AI從此不再是一個簡單的工具,更是陪伴人類的好夥伴。
圖 8: AzeroGPT 面對不同的使用者需求,扮演多種角色
「AI 終極形態」——國內首次在耳夾上實作人機互動
本次媒體溝通會上,國內首款「AI 配飾」——「FairyClip 聲智珍珠耳夾式耳機」證明了大模型在可穿戴器材上實作的可能。這款耳機采用開放聆聽技術,搭載了新一代AirAudio定向空氣傳音技術,音質清晰無漏音。此外,慢回彈耳夾的設計不僅美觀,而且戴起來絲毫沒有異物感,還不挑耳型,適合各種大小和形狀的耳朵。
圖 9: AzeroGPT 面對不同的使用者需求,扮演多種角色
耳機內建的專屬AI助理,能夠隨時響應使用者的指令,不僅可以實作轉寫、轉譯、內容生成等針對辦公學習場景的功能,還針對運動健康、日常生活的需求,提供健康數據檢測、助眠音訊以及生活事項提醒等功能。
此外,最新版本的聲智APP-小易問問功能新增熱點資訊問答能力,在 2024 巴黎奧運會期間還推出了奧運特別版,不僅能進行更加自然的即時對話,還能提供即時的賽事資訊,使用者可以和小易一起,隨時隨地觀賽、追賽。
圖 10: 透過耳機可以在 2024 巴黎奧運會期間實作 AI 追賽
至此,百元級別的耳機也能擁有與千元機同等的 AI 功能。AI 演算法的升級將使用者使用大模型的成本降到最低,真正做到技術普惠,人人都能享受到 AI 提供的專屬服務。
AI硬件與AI互動:全球AI落地的共識
人工智能技術發展至今,AI 硬件和 AI 互動已經是全球AI技術落地的共識。未來人工智能與聲學技術的結合,將會創造出更完美的互動智能體。它足夠智能,可以無時無刻地陪伴在你的身邊;它足夠全能,讓你的學習工作更高效;極具同理心的它,對你的了解甚至超過你身邊的任何人,還能幫助你解決生活中遇到的各種問題……
就像聲智 AI媒體溝通上播放的創意短劇【戴上耳機開啟龍少寵溺新篇章】和【重生之我是耳機】那樣,透過一枚小小耳機的視角,展示了聲智團隊對 AI 事業的熱愛和追求,以及青年團隊敢想敢做的態度,以當下最流行短劇形式,表達產品設計的初心。
圖 11: 由聲智釋出的短劇【戴上耳機開啟龍少寵溺新篇章】
圖 12: 由聲智釋出的短劇【重生之我是耳機】
明確的戰略規劃與前瞻性的布局、長期持續的底層技術投入以及以使用者為核心的產品能力,推動聲智科技勇敢前行,讓我們離夢想中的完美「大白」更近一步。