當前位置: 華文世界 > 科技

以後可能不用學外語了,OpenAI開發聲音引擎,可自由切換多國語言

2024-04-01科技
人工智能(AI)技術發展一日千裏,繼生成影像、影片功能後,美國AI開發公司OpenAI又推出「聲音引擎」(Voice Engine)系統,只要上傳15秒鐘自己的語音檔,就能用合成聲音替對方讀出任何一段文字,而且不限原來的語言,甚至可以轉化為中文。

也就是說,你用英語對「聲音引擎」念一段文字,它可以用西班牙語、法語、中文或任何語言,以你的聲音「發言」。

這項技術可套用於有聲書、網絡聊天機器人、廣播電台節目主持人等領域,但也可能被用來散播假訊息、進行詐騙或其他犯罪行為;OpenAI表示,認知到這些問題,因此將對更廣泛的釋出采取謹慎態度。 該公司產品開發經理哈裏斯(Jeff Harris)說,「基於合成語音濫用的可能性,我們將隨時掌握狀況。 」

OpenAI正在研究以「數碼浮水印」等方法,防範不法分子以「聲音引擎」為工具,偽造政治人物或名人的聲音做壞事;哈裏斯說,暫不公開發行「聲音引擎」,因為它很危險,尤其在選舉年。 公司也不想馬上靠這套AI技術賺錢;不過他說,這套系統對於因為生病或意外事故而喪失聲音的人特別有用。

AI助失聲患者重建說話功能哈裏斯指出,OpenAI幫助一名因腦癌損壞聲帶,不能說話的女性患者,利用她高中時留下的一小段錄音,重建說話功能。 這項技術為失聲患者帶來新的希望,也讓人們更加期待AI技術的未來發展。