當前位置: 華文世界 > 科技

網文作者打響AI訓練反擊戰

2024-07-26科技

平台對AI的「訓練」正在激怒越來越多的內容創作者。

近日,有網文作者在「龍的天空」網站上發文控訴,稱網絡文學平台「番茄小說」用作者的內容去「投餵」AI,催生出不少AI作者,遂要求解除AI協定。

與此同時,番茄小說被曝存在多個作品高度雷同的情況,有新手作者日更超過200本小說,遠超正常更新水平。

上述事件一經發酵後,許多作者選擇停更,甚至斷更。一位知名作者在其小說的最新一章表達了抗議,稱新協定出來後,很多作者一直在努力維權。「但是我們人微言輕,加上資訊繭房、(受到)嘲諷等各種原因,我無法堅持下去,也不會再在這裏寫了。」

網友質疑平台出現AI作者洗稿抄襲。圖源:受訪者

作者所指的AI協定,是與平台簽約時的一項合約條款,具體涉及以下內容:

甲方可將簽約作品的全部部份內容及相關資訊(包括作品名稱、簡介、大綱、章節、人物、作者個人資訊、封面圖等)、數據、語料、文本、素材等,用於標註、合成數據/數據庫建設、Al人工智能研發、機器學習、模型訓練、深度合成、演算法研發等目前已知或未來開發的新技術研發/套用領域,包括但不限於:

(1)用於智能對話、智能文本/影像/視聽/語音等作品/成品的編輯、生成、轉換、深度合成、虛擬現實技術等的研發和套用。

(2)用於任何技術下的Al人工智能模型訓練,或用於生成提供給模型訓練的合成數據/數據庫。

(3)其他任何新技術研發或套用場景。

註:甲方為番茄,乙方為作者

作為平台方的番茄小說很快給出了解決方案,刪除了原協定中Al模型訓練場景條款,給出了補充協定。

補充協定內容。圖源:受訪者

番茄小說作者羊羊也註意到了最新的補充條款,她選擇繼續簽約。在她看來,番茄小說比較適合新作者。羊羊是在兩個月前入駐番茄小說的,最近剛完結一篇20余萬字的小說。

但並非所有作者都給予認可,其中一些還在社交媒體發文,質疑平台補充協定的標點符號、分段是在「挖坑」,雙方的信任關系仍有待修復。

作者平平對於內容被用於AI訓練感到不滿,認為AI發展是趨勢,作為生產工具可以協助工作,解放勞動力,「但不應該是取代勞動力」。她希望番茄小說能釋出公告「承諾未來不會使用AI一鍵成文」等功能,之後再簽補充協定。

上述兩位作者都明確表示,未來會選擇離開番茄小說。

但眼下還有另一重麻煩,不少作者擔心會被平台方起訴泄露合約內容。一旦敗訴,賠償金也會是一筆不小的費用。

伴隨著人工智能的高速發展,使用者或創作者與平台間圍繞AI侵權的糾紛時有發生。即便是掀起AI大潮的OpenAI也多次被美國媒體狀告,在未經允許的前提下,後者的新聞報道被用於AI訓練。為此,OpenAI開始與媒體集團簽署合作協定。

美國知名女演員斯嘉麗·莊遜也曾指責OpenAI盜用她的聲音。該公司所推出的產品ChatGPT-4o中內建的語音之一「Sky」,與斯嘉麗的聲音極為相似。盡管OpenAI予以否認,但最終暫停使用了「Sky」的聲音。

剛剛釋出最強大模型的Meta,也會要求社交媒體Instagram使用者同意上傳的內容被用於AI訓練,否則無法使用該平台。

而在國內,界面新聞註意到,部份創業公司並不避諱透過采集公開發表的新聞報道或文章,用AI「洗稿」生產內容並盈利,也有一些公司的AI繪圖被畫師質疑抄襲。

對於上述情況,上海大邦律師事務所高級合夥人遊雲庭表示,在未取得作者授權的情況下,將作品用於AI訓練,‍‍涉嫌侵犯著作權法上規定的著作權的其他權利。但到目前為止,訓練是否構成侵權,尚沒有相應的‍‍法院判決可以來支持。‍正因為有一定的爭議性,即使被法院認定為侵權,也不構成犯罪。‍‍

遊雲庭補充稱,如果平台將作品用於AI訓練,需要跟作者單獨協商‍‍達成新協定。‍‍如果單方面改變協定內容,或在更新時強制簽署協定,就違反了現有合約,法院不會認可新合約的效力。

其次,如果平台聲稱AI訓練只是為了提升服務質素,而非商業盈利,這在法律上是站不住腳的,因為平台提升商業‍‍服務質素也是為了盈利,法院不會認可企業的抗辯。

平台普遍在進行的「AI訓練」更進一步引發了創作者對私有內容泄露的擔憂。近日,有網友稱,WPS疑似把作者未公開內容「餵」給抖音豆包AI,因在該AI上問出了相應內容。

對此,字節跳動稱相關傳言完全不實,豆包上部份書目資訊來源於公開資訊;豆包與WPS在AI訓練層面並未開展任何形式的合作,也沒有使用任何使用者未公開的私人數據進行訓練。而WPS官方也回應稱,相關問題完全失實。

不過,今年4月北京互聯網法院一審開庭宣判的全國首例AI生成聲音人格權侵權案,可以為內容創作者們維權提供一種借鑒。在該案中,配音師殷某發現,某軟件公司將其配音制作的作品AI化處理後出售給相關平台,該作品在多個知名App廣泛流傳。

法院經審理認定,被告文化傳媒公司對錄音制品享有著作權等權利,但不包括授權他人對原告聲音進行AI化使用的權利,其在未經原告本人知情同意的情況下,授權軟件公司AI化使用原告聲音的行為無合法權利來源。法院判決相關被告向原告賠禮道歉,並賠償損失共計25萬元。

法院指出,即使合法獲得了作品授權,也並不意味著有權將其進行AI訓練。這表明相關權利人、創作者對其作品等應有相應的控制權,僅憑模糊的授權條款,而不另行支付對價,不能保證平台可以進行AI訓練。

中國已於去年開始實施的【生成式人工智能服務管理暫行辦法】(下稱【辦法】)規定,在提供和使用生成式人工智能服務的過程中,應尊重知識產權、商業道德等,不得利用演算法、數據、平台等優勢實施壟斷和不正當競爭行為。

【辦法】還對生成式人工智能服務提供者提出了一系列規定,包括依法開展訓練數據處理活動、承擔網絡資訊內容生產者責任和個人資訊處理者責任、明確服務的適用人群等。

然而,要判定生成式AI侵權存在一定難度,包括侵權物件的界定、生成內容的獨創性判斷、證據收集和技術分析、法律適用的不確定性等問題。

其次,生成式AI的生成內容是向特定使用者提供的,本身不具有直接公開性,不會出現大規模的直接侵權現象,這與傳統的網絡侵權有所不同。

AI技術的不斷進步,也對法律的「思想-表達二分法」造成沖擊,傳統上「接觸+相似」的侵權判斷標準不再完全適用。生成式AI可以快速學習人類作品並生成不同的表達結果,導致「思想與表達」難以清晰「二分」,從而增加了侵權認定的難度。

整體而言,現有的法律規定難以完全涵蓋AI的套用場景和生成形式的所有情況。為了應對這些困難,法律界需要不斷探索和完善相關法律規定和侵權認定標準,綜合考慮技術特點、社會影響等多方面因素,以實作對生成式AI侵權行為的合理判定和有效規制。(應受訪者要求,羊羊、平平為化名)

(據界面新聞)

來源(大皖新聞)

版權歸原作者所有 如有侵權請及時聯系