當前位置: 華文世界 > 科技

雷軍AI語音屢禁不絕 誰該為此負責?

2024-10-14科技

經濟觀察網 記者 陳奇傑 馬雲、雷軍、周杰倫、川普……這些國內外公眾人物的真實聲音,被一些創作者使用AI音訊套用複制後,制作成語音角色,並釋出在AI音訊分享社群。使用者只需幾十秒鐘,便可依靠這些語音角色生成一段接近真人講話音質的AI音訊。

「十一」假期期間,網友制作了大量小米公司創始人雷軍的AI音訊,並在結合畫面合成音視訊後,將此類內容上傳到抖音、快手和B站等互聯網平台,其中不乏罵人、惡搞小米產品的語音,成為輿論熱點。而在9月底,一名犯罪嫌疑人利用AI音訊套用Reecho睿聲(下稱「睿聲」)偽造了三只羊創始人盧文慶的錄音,更是導致警方介入調查。

雷軍AI音訊事件發酵後,互聯網平台上的大量相關音訊被刪除,但仍有少量剩余。經濟觀察網記者在10月13日發現,使用者依然能夠使用睿聲AI音訊分享社群(下稱「睿聲社群」)裏名為「雷軍」的語音角色制作音訊,一個「雷軍」語音角色已被使用60.3萬次。

睿聲是深圳市言域科技有限公司(下稱「言域科技」)旗下的AI音訊套用和分享社群。言域科技創始人謝偉鐸告訴經濟觀察網,小米法務方面已與該公司取得聯系,希望其能對社群中涉及雷軍的音訊內容進行管控。目前,言域科技已通知原作者下架相關內容,如果原作者在7個工作日內沒有下架,該公司會進行強制刪除。

AI音訊制作者、語音角色創作者、AI音訊套用和分享社群、互聯網平台,共同構成了制作公眾人物AI音訊的上下遊鏈條。當此類音訊引發負面輿情時,鏈條上的涉事各方分別需要承擔什麽責任?被侵權人能否利用現有技術精準追溯到肇事方?

制作者的責任

目前,AI音訊制作者主要透過兩種形式生成公眾人物的音訊。

第一種方式為,AI音訊制作者直接使用AI技術提供方的技術生成音訊。謝偉鐸說,此前,合肥警方透過互聯網平台溯源找到了偽造盧文慶錄音的犯罪嫌疑人,在其電腦上看到了使用睿聲的記錄。言域科技配合警方調取了該嫌疑人的生成記錄以作證據。

言域科技方面披露,該嫌疑人截取了盧文慶在直播中大約30秒的情緒較為飽滿的音訊作為素材,並用自己編撰的文本在睿聲的平台上進行合成。其後,該嫌疑人在一個較為嘈雜空曠的環境中,播放合成後的音訊,並用其他錄音裝置分段做翻錄及拼接。這一操作增加了環境氛圍感,導致眾多網友難以區分該錄音是真實還是偽造。

第二種方式為,創作者上傳公眾人物的真實聲音,複制出接近其聲音的語音角色,並分享至AI音訊分享社群上,其他制作者可以直接使用此類語音角色再生成AI音訊。相比前一種,第二種生成AI語音的方式更加便捷。

經濟觀察網記者在睿聲社群中選擇一個名為「雷軍」的語音角色,輸入200個字元的文字,點選生成音訊。不到一分鐘,一段仿造雷軍講話的AI音訊就被制作出來。

截至10月13日,睿聲社群的一個「雷軍」語音角色,被使用次數為60.3萬次,生成字元數為3371.8萬個;在AI音訊套用Fish Audio上,一個「雷軍」語音角色被使用了17.4萬次。

網友在制作公眾人物的AI音訊時,往往不會註意此類行為需要得到授權,一位B站使用者說,他只是看到很多人合成雷軍的AI音訊,於是萌生了制作雷軍AI語音解說遊戲視訊的想法。 另一位制作了類似視訊的B站使用者稱,「(這種視訊)網上很多,應該沒事,有提示違規我就刪」。

泰和泰律師事務所律師杜雙告訴經濟觀察網,根據現有司法判定標準,高度可辨識的AI生成聲音受到法律保護。AI配音素材提供者、視訊制作者未經雷軍本人或小米公司授權,將其AI生成的聲音用於制作、傳播具有辱罵、誹謗性質的音視訊內容,本身已構成對雷軍肖像權、名譽權等多項人格權侵權,甚至會侵犯小米公司的名譽。

技術提供方的義務

在前述兩種AI音訊制作方式中,AI音訊套用公司扮演了不同的角色。在第一種方式下,他們僅充當AI技術提供方。在第二種方式下,他們則具備AI技術提供方和營運方的雙重內容。

言域科技創始人謝偉鐸認為,AI套用只是內容轉化的工具,在內容把控方面,更優先的選項是由使用者負責。作為使用者生成內容(UGC)社群,在合法合規的情況下,言域科技並不願過度幹預使用者生產的內容。

因此,言域科技主要透過提示使用者和內容溯源的形式,進行合規經營。

言域科技在官網上提醒使用者,請勿使用其服務複制或生成任何侵犯版權、違反道德倫理或違反中華人民共和國法律法規的內容。

三只羊偽造錄音事件後,言域科技回應稱,其正在部署包括強化的實名認證機制,強化的敏感詞多維度智慧偵測預警,以及可溯源音訊浮水印等多重安全措施。

謝偉鐸說,現在使用者使用睿聲生成的所有內容都可以被溯源到,能溯源到的資訊包括技術平台以及內容制作使用者等。

內容可溯源是監管方面對AI技術提供方和營運方的要求。全國資訊保安標準化技術委員會秘書處去年8月釋出的【網路安全標準實踐指南—生成式人工智慧服務內容標識方法】稱,由人工智慧生成圖片、音訊、視訊時,應在生成內容中添加顯式浮水印和隱式浮水印標識。

杜雙稱,根據【互聯網資訊服務深度合成管理規定】(下稱【管理規定】),AI技術提供方還擁有加強訓練數據管理、保障訓練數據安全、保護個人資訊等義務。同時,對提供人臉、人聲等生物辨識資訊編輯功能的,應當提示技術使用者依法告知被編輯的個人,並取得其單獨同意。

經濟觀察網註意到,一些創作者制作的「馬雲」「周杰倫」「川普」「蔡徐坤」等語音角色,被釋出在睿聲社群的首頁上,並且可以被未註冊使用者看到。此時,這些公眾人物的語音角色成了AI音訊套用公司吸引流量的工具。

杜雙說,這種情形下,制作語音角色的創作者已經構成侵權。AI音訊分享社群如果發現侵權行為或者權利人投訴舉報,需要及時刪除下架相關素材。如果不及時刪除,AI音訊分享社群需要承擔一定的侵權責任。

謝偉鐸說,目前睿聲正在和一些配音演員合作,考慮推出高品質的官方角色。未來可能也會在驗證過版權的情況下,開展使用者出售聲音版權的業務。

平台:寄望於使用者標識

在本次雷軍AI音訊事件中,抖音、快手和B站等互聯網平台是主要傳播渠道。面對越來越多的AI生成內容,互聯網平台有何責任?

杜雙說,作為傳播渠道的平台方,同樣受【中華人民共和國網路安全法】【管理規定】規制,針對可能導致公眾混淆或者誤認的深度合成技術,應當在生成或者編輯的資訊內容的合理位置、區域進行顯著標識,向公眾提示深度合成情況。

目前,主流社交平台對AI內容采取的措施,一般是先讓使用者做出聲明,並在AI生成的內容旁標註類似於「本內容為AI生成」標識。

經濟觀察網從快手方面了解到,其在2023年9月上線了AI內容作者聲明功能,並要求使用者在釋出人工智慧生成內容時,務必添加作者聲明,避免AI內容在傳播過程中帶來誤解。

B站、抖音等視訊內容平台同樣采取了類似的措施。例如,抖音在使用者服務協定中提到,使用者不得利用基於深度學習、虛擬現實等的新技術新套用制作、釋出、傳播虛假新聞資訊資訊。使用者在釋出或傳播利用基於深度學習、生成式人工智慧等新技術新套用制作的非真實音視訊資訊,或其他可能導致公眾混淆或誤認的資訊內容時,應當以顯著方式予以標識。

對於未以顯著方式標識的AI生成內容,B站的使用者協定還進一步提示,B站「有權對相關內容和帳戶采取包括但不限於增加標識、限制、封禁等措施」。

但經濟觀察網記者為抖音、B站上傳一段AI音視訊後發現,在不主動選擇對該音視訊作出標註的情況下,兩家平台都沒有檢測出該音視訊為AI生成。

一家AI鑒偽公司的高管曾接觸過互聯網平台。在他看來,出於自身成本及監管力度等綜合原因,目前互聯網平台對AI偽造內容的管理意願還不高。