當前位置: 華文世界 > 科技

精準學推出中國第一個語音端到端大模型,助力 AI 輔學體驗更上一階

2024-08-23科技

做 AI 硬體,關隘不在硬體在 AI,做 AI 輔學硬體,端到端的 AI 語音互動尤為關鍵。正如 GPT-4o 扮演老師角色,讓可汗學院創始人薩爾·汗和他的兒子伊姆蘭也驚艷於它的數學題解答和教學能力。

雖然 GPT-4o 能力很強,但一直以來,開源社群缺少中文為主的高品質語音 Codec 和自監督預訓練 Encoder 基礎設施,讓很多有計劃使用 AI 大模型做教育套用的企業很難在對話體驗上實作突破。

深圳灣 8 月 23 日訊息,來自浙江的教育科技公司精準學宣布,公司已在 AI 語音互動技術上取得領先性的突破,成功訓練了中國第一個語音端到端大模型「心流知鏡-s(V02)」,它可以直接實作「語音輸入-語音輸出」的互動,在適配輔學場景後,大模型可以生成更加自然的對話交流體驗,讓 AI 達到「真人老師」級別。

精準學 AI 實驗室從零開始訓練,使用端到端語音結構,避免了級聯 ASR+LLM+TTS 方式額外延遲,同時也更好的改善純文本模型損失的情感節奏等豐富資訊,讓 AI 語音互動更加接近人類的對話體驗。

為回饋開源社群,精準學還將提供時間表,逐步開放基礎模型,供學術和非商用使用,為科研和技術探索作出貢獻,促進 AI 語音技術更好的服務於社會。

今年 5 月,精準學曾獲得阿裏 2 億元融資。次月,精準學第一個原生代 AI 輔學機 Bong 系列上架銷售,主打 AI 老師一對一輔學功能,這也是行業內首次有產品繞過助手工具,正面提供一對一的 AI 輔學功能。

此次釋出的語音端到端大模型也將很快套用於精準學的 AI 輔學機上,深圳灣的讀者也將在 9 月份的 AI 硬體線下交流活動上,很快體驗到這項技術突破成果。

主筆:周森 / 深圳灣