雷軍AI語音屢禁不絕 誰該為此負責？

2024-10-14科技

經濟觀察網記者陳奇傑 馬雲、雷軍、周杰倫、川普……這些國內外公眾人物的真實聲音，被一些創作者使用AI音訊套用複制後，制作成語音角色，並釋出在AI音訊分享社群。使用者只需幾十秒鐘，便可依靠這些語音角色生成一段接近真人講話音質的AI音訊。

「十一」假期期間，網友制作了大量小米公司創始人雷軍的AI音訊，並在結合畫面合成音視訊後，將此類內容上傳到抖音、快手和B站等互聯網平台，其中不乏罵人、惡搞小米產品的語音，成為輿論熱點。而在9月底，一名犯罪嫌疑人利用AI音訊套用Reecho睿聲（下稱「睿聲」）偽造了三只羊創始人盧文慶的錄音，更是導致警方介入調查。

雷軍AI音訊事件發酵後，互聯網平台上的大量相關音訊被刪除，但仍有少量剩余。經濟觀察網記者在10月13日發現，使用者依然能夠使用睿聲AI音訊分享社群（下稱「睿聲社群」）裏名為「雷軍」的語音角色制作音訊，一個「雷軍」語音角色已被使用60.3萬次。

睿聲是深圳市言域科技有限公司（下稱「言域科技」）旗下的AI音訊套用和分享社群。言域科技創始人謝偉鐸告訴經濟觀察網，小米法務方面已與該公司取得聯系，希望其能對社群中涉及雷軍的音訊內容進行管控。目前，言域科技已通知原作者下架相關內容，如果原作者在7個工作日內沒有下架，該公司會進行強制刪除。

AI音訊制作者、語音角色創作者、AI音訊套用和分享社群、互聯網平台，共同構成了制作公眾人物AI音訊的上下遊鏈條。當此類音訊引發負面輿情時，鏈條上的涉事各方分別需要承擔什麽責任？被侵權人能否利用現有技術精準追溯到肇事方？

制作者的責任

目前，AI音訊制作者主要透過兩種形式生成公眾人物的音訊。

第一種方式為，AI音訊制作者直接使用AI技術提供方的技術生成音訊。謝偉鐸說，此前，合肥警方透過互聯網平台溯源找到了偽造盧文慶錄音的犯罪嫌疑人，在其電腦上看到了使用睿聲的記錄。言域科技配合警方調取了該嫌疑人的生成記錄以作證據。

言域科技方面披露，該嫌疑人截取了盧文慶在直播中大約30秒的情緒較為飽滿的音訊作為素材，並用自己編撰的文本在睿聲的平台上進行合成。其後，該嫌疑人在一個較為嘈雜空曠的環境中，播放合成後的音訊，並用其他錄音裝置分段做翻錄及拼接。這一操作增加了環境氛圍感，導致眾多網友難以區分該錄音是真實還是偽造。

第二種方式為，創作者上傳公眾人物的真實聲音，複制出接近其聲音的語音角色，並分享至AI音訊分享社群上，其他制作者可以直接使用此類語音角色再生成AI音訊。相比前一種，第二種生成AI語音的方式更加便捷。

經濟觀察網記者在睿聲社群中選擇一個名為「雷軍」的語音角色，輸入200個字元的文字，點選生成音訊。不到一分鐘，一段仿造雷軍講話的AI音訊就被制作出來。

截至10月13日，睿聲社群的一個「雷軍」語音角色，被使用次數為60.3萬次，生成字元數為3371.8萬個；在AI音訊套用Fish Audio上，一個「雷軍」語音角色被使用了17.4萬次。

網友在制作公眾人物的AI音訊時，往往不會註意此類行為需要得到授權，一位B站使用者說，他只是看到很多人合成雷軍的AI音訊，於是萌生了制作雷軍AI語音解說遊戲視訊的想法。另一位制作了類似視訊的B站使用者稱，「（這種視訊）網上很多，應該沒事，有提示違規我就刪」。

泰和泰律師事務所律師杜雙告訴經濟觀察網，根據現有司法判定標準，高度可辨識的AI生成聲音受到法律保護。AI配音素材提供者、視訊制作者未經雷軍本人或小米公司授權，將其AI生成的聲音用於制作、傳播具有辱罵、誹謗性質的音視訊內容，本身已構成對雷軍肖像權、名譽權等多項人格權侵權，甚至會侵犯小米公司的名譽。

技術提供方的義務

在前述兩種AI音訊制作方式中，AI音訊套用公司扮演了不同的角色。在第一種方式下，他們僅充當AI技術提供方。在第二種方式下，他們則具備AI技術提供方和營運方的雙重內容。

言域科技創始人謝偉鐸認為，AI套用只是內容轉化的工具，在內容把控方面，更優先的選項是由使用者負責。作為使用者生成內容（UGC）社群，在合法合規的情況下，言域科技並不願過度幹預使用者生產的內容。

因此，言域科技主要透過提示使用者和內容溯源的形式，進行合規經營。

言域科技在官網上提醒使用者，請勿使用其服務複制或生成任何侵犯版權、違反道德倫理或違反中華人民共和國法律法規的內容。

三只羊偽造錄音事件後，言域科技回應稱，其正在部署包括強化的實名認證機制，強化的敏感詞多維度智慧偵測預警，以及可溯源音訊浮水印等多重安全措施。

謝偉鐸說，現在使用者使用睿聲生成的所有內容都可以被溯源到，能溯源到的資訊包括技術平台以及內容制作使用者等。

內容可溯源是監管方面對AI技術提供方和營運方的要求。全國資訊保安標準化技術委員會秘書處去年8月釋出的【網路安全標準實踐指南—生成式人工智慧服務內容標識方法】稱，由人工智慧生成圖片、音訊、視訊時，應在生成內容中添加顯式浮水印和隱式浮水印標識。

杜雙稱，根據【互聯網資訊服務深度合成管理規定】（下稱【管理規定】），AI技術提供方還擁有加強訓練數據管理、保障訓練數據安全、保護個人資訊等義務。同時，對提供人臉、人聲等生物辨識資訊編輯功能的，應當提示技術使用者依法告知被編輯的個人，並取得其單獨同意。

經濟觀察網註意到，一些創作者制作的「馬雲」「周杰倫」「川普」「蔡徐坤」等語音角色，被釋出在睿聲社群的首頁上，並且可以被未註冊使用者看到。此時，這些公眾人物的語音角色成了AI音訊套用公司吸引流量的工具。

杜雙說，這種情形下，制作語音角色的創作者已經構成侵權。AI音訊分享社群如果發現侵權行為或者權利人投訴舉報，需要及時刪除下架相關素材。如果不及時刪除，AI音訊分享社群需要承擔一定的侵權責任。

謝偉鐸說，目前睿聲正在和一些配音演員合作，考慮推出高品質的官方角色。未來可能也會在驗證過版權的情況下，開展使用者出售聲音版權的業務。

平台：寄望於使用者標識

在本次雷軍AI音訊事件中，抖音、快手和B站等互聯網平台是主要傳播渠道。面對越來越多的AI生成內容，互聯網平台有何責任？

杜雙說，作為傳播渠道的平台方，同樣受【中華人民共和國網路安全法】【管理規定】規制，針對可能導致公眾混淆或者誤認的深度合成技術，應當在生成或者編輯的資訊內容的合理位置、區域進行顯著標識，向公眾提示深度合成情況。

目前，主流社交平台對AI內容采取的措施，一般是先讓使用者做出聲明，並在AI生成的內容旁標註類似於「本內容為AI生成」標識。

經濟觀察網從快手方面了解到，其在2023年9月上線了AI內容作者聲明功能，並要求使用者在釋出人工智慧生成內容時，務必添加作者聲明，避免AI內容在傳播過程中帶來誤解。

B站、抖音等視訊內容平台同樣采取了類似的措施。例如，抖音在使用者服務協定中提到，使用者不得利用基於深度學習、虛擬現實等的新技術新套用制作、釋出、傳播虛假新聞資訊資訊。使用者在釋出或傳播利用基於深度學習、生成式人工智慧等新技術新套用制作的非真實音視訊資訊，或其他可能導致公眾混淆或誤認的資訊內容時，應當以顯著方式予以標識。

對於未以顯著方式標識的AI生成內容，B站的使用者協定還進一步提示，B站「有權對相關內容和帳戶采取包括但不限於增加標識、限制、封禁等措施」。

但經濟觀察網記者為抖音、B站上傳一段AI音視訊後發現，在不主動選擇對該音視訊作出標註的情況下，兩家平台都沒有檢測出該音視訊為AI生成。

一家AI鑒偽公司的高管曾接觸過互聯網平台。在他看來，出於自身成本及監管力度等綜合原因，目前互聯網平台對AI偽造內容的管理意願還不高。

雷軍AI語音屢禁不絕 誰該為此負責？

雷軍AI語音屢禁不絕誰該為此負責？