當前位置: 華文世界 > 科技

AI生成內容的「非作品」內容探討——兼評北互「AI文生圖第一案」

2024-02-10科技

在當前法律和技術框架下,「AI文生圖第一案」中的人工智能生成內容不具有著作權意義上的「作品」內容。

原題 | 人工智能生成內容的「非作品」內容探討——兼評北京互聯網法院「AI文生圖第一案」

作者 | 安筱瓊 姜潤 北京高文律師事務所

編輯 | 布魯斯

2023年12月27日,北京互聯網法院在其微信公眾號上以【「AI文生圖」著作權案一審生效】為題,釋出了其剛剛審結的一起與人工智能生成圖片相關的侵害作品署名權和資訊網絡傳播權糾紛案件(簡稱「AI文生圖第一案」或「該案」),案號為(2023)京0491民初11279號。在該案中,法院首次明確了使用者利用人工智能(AI)生成的圖片具有「作品」內容,使用者具有「創作者」身份。

這一裁判結論,在國內著作權理論界和實務界引發了廣泛的、熱烈的討論,不同的專家、學者或律師們等專業人員的觀點各異,可謂仁者見仁、智者見智。該案作為中國「AI文生圖第一案」必將對中國乃至世界人工智能生成內容領域的技術發展和法律研究產生深遠影響。

筆者對該案判決中的部份觀點和結論持贊同意見,但對該案判決關於「作品」內容及「作者」身份的核心裁判結論持反對意見,故撰寫本文,嘗試從人工智能的技術本質、法律邏輯、法經濟學等不同角度對該案的法律焦點問題進行分析,進而得出在當前法律和技術框架下,該案中的人工智能生成內容不具有著作權意義上的「作品」內容的判斷,同時建議司法機關應當對類似人工智能生成內容的保護采取謹慎和謙抑的態度,並使裁判規則具有明確的代表性和可預期性。

一、AI文生圖第一案介紹

(一)案情簡介

原告透過某網站、某使用者、某影片下方的網盤連結自由選取、公開下載Stable Diffusion相關的兩個模型,整合後透過在Stable Diffusion輸入正反兩方面提示詞的方式生成了涉案圖片。具體方法:原告下載Stable Diffusion相關模型,隨後在正向提示詞與反向提示詞中分別輸入數十個提示詞,設定叠代步數、圖片高度、提示詞引導系數以及隨機數種子,生成第一張圖片;之後原告透過修改其中一個模型的權重、修改隨機種子、增加正向提示詞內容等方式又分別對應生成了第二張、第三張、第四張圖片,其中第四張圖片為涉案圖片。之後原告將涉案圖片釋出在小紅書平台。被告在百家號上釋出文章配圖使用了涉案圖片。原告認為被告的行為侵犯了原告的署名權和資訊網絡傳播權,被告辯稱不確定原告是否享有涉案圖片的著作權。由此,中國備受關註的「AI文生圖第一案」拉開帷幕。

(二)法院生效裁判要點

北京互聯網法院經審理後認為,涉案圖片符合作「作品」定義,屬於「作品」,原告是涉案圖片的作者,享有涉案圖片的著作權。

法院認為,審查原告主張著作權的客體(即涉案圖片)是否構成作品,需要考慮如下要件:1.是否屬於文學、藝術和科學領域內;2.是否具有獨創性;3.是否具有一定的表現形式;4.是否屬於智力成果。

法院根據上述構成要件,對該案事實進行了如下評價:

第一, 從涉案圖片的外觀上來看,其與通常人們見到的照片、繪畫無異,顯然「屬於藝術領域」,具有「一定的表現形式」,即滿足要件1和要件3。

第二, 涉案圖片系原告利用生成式人工智能技術生成的。從原告構思涉案圖片起,到最終選定涉案圖片止,原告進行了一定的智力投入,比如設計人物的呈現方式、選擇提示詞、安排提示詞的順序、設定相關的參數、選定哪個圖片符合預期等。涉案圖片體現了原告的智力投入,具備「智力成果」要件,即滿足要件4。

第三, 從涉案圖片本身來看,體現出了與在先作品存在可以辨識的差異性。從涉案圖片生成過程來看,一方面,原告對於人物及其呈現方式等畫面元素透過提示詞進行了設計,對於畫面布局構圖等透過參數進行了設定,體現了原告的選擇和安排。另一方面,原告透過輸入提示詞、設定相關參數,獲得了第一張圖片後,繼續增加提示詞、修改參數,不斷調整修正,最終獲得涉案圖片,這一調整修正過程體現了原告的審美選擇和個性判斷。在無相反證據的情況下,可以認定涉案圖片由原告獨立完成,體現出了原告的個人化表達,因此涉案圖片具備「獨創性」要件,即滿足要件2。

綜上,法院判定涉案圖片屬於作品。法院進一步認為,涉案圖片是以線條、色彩構成的有審美意義的平面造型藝術作品,屬於美術作品,應當受到著作權法的保護。原告是涉案圖片的作者,享有涉案圖片的著作權,被告的行為對原告構成侵權,並承擔賠禮道歉、賠償500元經濟損失的法律責任。

二、人工智能生成內容的「非作品」內容探討

筆者認為,法院的上述論證不夠準確。在筆者看來,「AI文生圖第一案」中的人工智能生成內容並不具有「作品」內容,不構成作品,原告也不享有涉案圖片的著作權。

【著作權法】第三條規定:

「本法所稱的作品,是指文學、藝術和科學領域內具有獨創性並能以一定形式表現的智力成果。」

【著作權法】第十一條第二款規定:

「創作作品的自然人是作者。」

根據常識,【著作權法】第三條關於「作品」的定義和第十一條第二款關於「作者」的定義,都是典型的「主系表」結構,提取句子主幹後得出的核心內容是「作品是智力成果」和「作者是自然人」,這是作品和作者的法律本質定性。而作品與作者的關系密不可分、相輔相成——作品來源於自然人作者[1]的創作,自然人作者的具體創作行為表現為自然人的智力投入,自然人創作行為產出的結果是智力成果。故,筆者認為,我們在判斷一項成果是否屬於著作權法意義上的作品時,首先應當考查該成果是否屬於「自然人作者」透過「自身智力投入」所產出的 「智力成果」。如回答「是」,則有必要進一步考查是否滿足【著作權法】第三條所規定的「文學、藝術和科學領域」「獨創性」「以一定形式表現」等要件;如回答「否」,則無需再進一步考查其他要件,就可以直接否定該成果在著作權法意義上的「作品」內容。

(一)人工智能模型及其設計者不具有「作者」身份

在「AI文生圖第一案」中,法院認為,雖然涉案圖片是涉案人工智能模型所「畫」,但是該模型無法成為涉案圖片的作者。…本案繼續堅持著作權法只保護「自然人創作」的觀點,而人工智能模型不具備自由意誌,不是法律上的主體,不能成為中國著作權法上的「作者」。此外,法院還認為,人工智能模型設計者…並未參與到涉案圖片的生成過程中,於本案而言,其僅是創作工具的生產者。…設計者的智力投入…體現「創作工具」的生產上,而不是涉案圖片上,故涉案人工智能模型設計者不是涉案圖片的作者。

對上述論點,筆者高度認同。在新一代生成式人工智能技術快速變革和發展的今天,越來越多的人們利用生成式人工智能模型進行創作,從而使得創作效率大幅提高,這是技術進步帶給人類的便捷和好處,值得肯定和鼓勵;但在鼓勵的同時,我們也應當清醒地認識到人們利用人工智能模型生成圖片本質上仍然是人利用工具進行創作。故人工智能模型的智能水平無論多高,無論是否超越人類智力,都不可能成為著作權法意義上的「作者」。而人工智能模型的設計者,其智力投入並未體現在涉案圖片上,所以也不能成為涉案圖片的作者。

既然如此,那麽到底哪些主體才能成為人工智能生成內容的作者?筆者認為並無統一結論,仍需結合使用者在人工智能生成過程中是否付出了創造性的「智力投入」,以及人工智能生成內容是否可以構成著作權法意義上的「作品」等問題,進行個案的綜合分析和判斷。

(二)人工智能生成內容不具有「作品」內容

如前所述,在該案中,法院在審查涉案圖片是否構成作品時,提到了4項構成要件,並在逐一評價分析後認為涉案圖片體現了原告的智力投入,故具備「智力成果」要件。

對此論點,筆者持反對意見。筆者認為,在現有的技術條件和人工智能模型的功能之下,「AI文生圖第一案」中的原告即使用者僅僅透過自由選取人工智能模型、自主決定輸入哪些提示詞、自由設定或修正哪些參數、最終選定哪張圖片等行為所產出的人工智能生成內容,尚不足以構成「自然人作者」透過「自身智力投入」所產出的「智力成果」,故涉案圖片不具有著作權法意義上的「作品」內容,原告即使用者也並非「創作者」身份,不應透過著作權法「作品」和「作者」規則予以保護,試析之。

1、從人工智能的底層技術角度分析

(1)人工智能不等於人類智力

由於不同語言轉譯問題,國內AI領域關於「智能」和「智力」的中英轉譯存在一定混亂和不精準,給相關公眾造成了極大誤解。準確地講,英文單詞intelligence應該轉譯為「智能」,其準確詞語意思是智慧和能力,以及經高科技處理、具有人的某些智慧和能力。而英文單詞intellect應該轉譯為「智力」,(尤指高等的)思維邏輯領悟力,其準確詞語意思是指人認識、理解客觀事物並運用知識、經驗等解決問題的能力,包括記憶、觀察、想象、思考、判斷等[2]。顯然,人工智能強調的是經高科技處理過的電腦所擁有的模擬人類智慧和能力的機器智慧和計算能力,其突出的是演算法、算力;而人類智力強調的是自然人人格所特有的抽象的思維能力和創造能力,二者不是同一個領域的等同概念,不能互換。如果不了解這一點,會給後續的理解造成混亂。

(2)人工智能模型與人類智力的本質不同

人工智能模型是根據演算法和數據建立的虛擬的電腦系統,其本質是基於數學、算力、模型、演算法構成的物理系統,其核心是「演算法」和「算力」。當輸入人工智能模型的數據量足夠龐大時,電腦透過演算法輸出的結果一定會超越人類智力所能反應或感知的那個「有限」的範圍,例如:某工智能語言模型裏有7500億條語言數據,計算速度每秒上億次,這樣的算力是人類智力根本無法比擬甚至無法想象的。從這個角度上看,人工智能貌似是「無限」的,而人類智力是「有限」的,但這其實是一種誤解,這是因為人工智能既為電腦「演算法」,就是物理學上的機械存在,無論其數據量或生產的內容能否完全為人類智力所反應或感知,但理論上都可以透過一定的數學方法和計算規則計算得出最大的範圍和限度,所以正確的理解是人工智能是確定「有限」的,只不過由於數量級太大,超出了人類目前的認知嘗試,才被誤以為是「無限」的。但人類智力則不同,它是產生於人類大腦的、基於生物學基礎的不可完全探知的神經系統,來源於上億的神經細胞和不計其數的神經連線。雖然人類目前無法理解人類大腦的精準的執行機理,但可以肯定的是,我們不能簡單地將其與人工智能模型中所謂的「神經網絡」相提並論。人之所以為人,其本質是人類大腦所擁有的具有無限想象能力、創造能力的生物學系統上的人類智力。雖然人腦和人類智力在數據、算力、演算法等方面不如電腦以及人工智能,但二者的本質不在同一個層面上。

(3)人工智能模型的工具性輸出結果,與照相機、智能電話不同

我們知道,攝影師借助照相機、智能電話等現代工具進行創作時,照相機、智能電話等工具都僅僅起到「通道」的作用,它們不會在發揮「通道」作用的過程中對原物進行任何改變,換句話說,人類使用照相機、智能電話等工具創作之後所形成的具象表達,與人類的智力投入內容基本一致,符合「自然人作者 + 自身智力投入 = 智力成果」的等式,故應該對攝影成果進行「作品」保護。

而人工智能則不同,其本身是電腦透過規則和演算法對訓練數據進行計算、學習後所形成的超大數量級的新數據,其輸出結果也因為「語意資訊和圖片像素的對應和匹配」關系而具有了一定的概率性和多樣性。雖然從電腦的底層邏輯上看,這種「概率性和多樣性」是一定的數學方法和計算規則下的必然產物,是確定的,但當「數量級」足夠龐大和復雜的時候,這種所謂的「確定性」也已超越了人類智力所能直接感知、辨識、匹配、轉化、生成和預期的範圍了。故從某種程度上講,我們也可以認為人工智能模型已不再單純地扮演工具性的「通道」角色,而是在一定程度上「脫離」了使用者「人類智力」的控制,並對其進行了一定程度的「加工」,因此也才有了人工智能的輸出結果不符合使用者的具象表達的預期而不被滿意、不被選擇的現實性。所以,人工智能雖然本質上仍是工具,但由於其特殊性的存在,還是不應比照照相機、智能電話等「通道」性工具來確立人工智能生成內容的法律保護路徑。

2、從法律及邏輯角度分析

(1)從著作權法的立法意圖分析

著作權法所保護的是「具象的表達」,而不是「非具象的思想」。表達來源於思想,又脫離於思想而獨立存在。傳統畫家在創作畫作的時候,會事先在腦海中進行構思(非具象的思想),並對畫布上最終呈現的畫面效果形成基本的輪廓和樣貌(具象的表達)。但在人工智能環境下,大模型訓練使用的數據越多,人工智能輸出結果的不確定性和多樣性就越大,使用者對輸出結果也就越難以預期。即便能夠預期,也只能說其僅僅是思想層面的預期,而非具象的表達層面的預期。例如:在「AI文生圖第一案」中,Stable Diffusion模型輸出的第一張、第二張、第三張圖片,均超越了原告的具象的預期,均未達到原告滿意,也未被原告選定。因此無論使用者輸入的提示詞或設定的參數是多是少、使用者是否進行了調整或修正,都不足以將這些簡單的人類勞動作為著作權法意義上的創造性的智力投入進行保護。否則,但凡有人的思想的參與,或者退一步講,有一定程度的人類智力的投入但又未形成具象的表達時,就要對其進行著作權法保護的話,則完全撼動了著作權法保護「具象表達」的立法意圖。

(2)從涉案圖片權利來源的合法性和真實性分析

雖然法院已經明確將人工智能模型及其設計者排除在涉案圖片的「作者」身份之外並判定原告是涉案圖片的著作權人,但法院並未進一步從根源上探究原告關於涉案圖片的權利來源——即Stable Diffusion模型輸出的基礎圖片(即第一張圖片)的合法性問題,例如:基礎圖片的著作權來自哪裏?是否存在上遊著作權人或原始著作權人?是否取得了上遊或原始著作權人的合法特許?是否侵犯他人的肖像權或私密權?如果這些問題沒有同步解決的話,那麽原告透過對基礎圖片進行調整或修正後所得到的涉案圖片的著作權也就存在權利鏈條上的瑕疵。借鑒刑法「毒樹之果」理論,如果Stable Diffusion模型的設計者在訓練該模型時所使用的大量數據被認定為侵權或非法,那麽原告透過使用Stable Diffusion模型所生成的涉案圖片也同樣應當經受合法性的拷問。[3]

此外,筆者註意到,該案主審法官在「法官說法」中提到「人工智能模型不具備自由意誌,不是法律上的主體,不能成為中國著作權法上的‘作者’;本案繼續認定,一般情況下利用AI生成圖片的權益歸屬於利用人工智能軟件的人」——這是否意味著,在法院看來,在人工智能模型不能成為著作權法主體的情況下,著作權法必須要為人工智能輸出的基礎圖片(即第一張圖片)及隨後生成的第二張、第三張、第四張圖片等找到一個著作權法上的「作者」?筆者認為,當然不是,也不能這樣推論,因為即便按照最傳統的著作權法理論,也不可能對所有的人類勞動成果進行著作權法意義上的保護,更何況是面對人工智能生成內容這一新興事物。

(3)從著作權法的確權思路和邏輯沖突分析

德國著名哲學家萊布尼茨在談到「相異律」時提到,世界上沒有完全相同的兩片樹葉。同理,即便是同一個畫家,在最為接近的時間內,也不可能創作出兩幅一模一樣的畫作,所以按照傳統著作權法的確權思路,法律應當對畫家的這兩次創作行為所產生的兩幅畫作分別確權,產生兩個著作權。此外,傳統畫家在創作畫作的時候,只要畫家能夠將畫作以一定的形式表現出來,即便畫家對畫作效果並不滿意,也不妨礙該畫作本身構成作品,以及對畫家進行確權。但在生成式人工智能模型中,上述確權思路受到嚴重挑戰。

第一, 在人工智能模型訓練數據不增不減、相對靜止和封閉的狀態下,相同的人(包括原告)在不同的時間輸入相同的提示詞、設定相同的參數後所出現的輸出結果,在理論上是存在完全相同的可能性的。在此情況下,世界上出現了「完全相同的兩片樹葉」,但本質仍為同一生成內容,只能進行一次確權,產生一個著作權,這就與傳統的兩次確權形成了沖突。

第二, 不同的人在輸入相同的提示詞、設定相同的參數後出現相同的輸出結果,法律應該為誰確權?是按照時間順序先後確權,還是共同享有著作權?

第三, 更為復雜的是,在使用者利用人工智能模型進行非具象的思想構思後,人工智能輸出結果並不是使用者所預期的具象的表達時,使用者在繼續進行多次的調整或修正後,最終選定自己最滿意的那個輸出結果,但是在整個輸入、輸出、調整/修正、再輸入、再輸出、再調整/修正……過程中,對於每一個步驟、每一次調整或修正的過程性輸出結果,尤其是對於那些因用者不滿意而被放棄的過程性輸出結果,又該怎麽確權呢?最為極端的情況是,如果使用者對所有輸出結果均不滿意時,是全部不予確權還是全部予以確權?而對於使用者而言,為了更好地保護這些生成內容,他是否要花費成本對每一個操作步驟進行留痕存證?

在「AI文生圖第一案」中,法院僅對原告最為滿意並選定的第四張圖片進行了確權,並未提及第一張、第二張、第三張圖片該如何處理。但無論如何處理,如果要求裁判者圍繞著「使用者是否滿意某一輸出結果、是否最終選定某一輸出結果」來決定是否要對輸出結果進行司法確權的話,也過於隨意和不可預測,司法權威將不復存在。

綜上,如果裁判者不能一攬子解決這些連帶的邏輯性矛盾的話,就不能想當然地將使用者輸入幾百、上千,乃至上萬、上億次的正向提示詞、反向提示詞等簡單勞動認定為人在人工智能生成的過程中進行了創造性的智力投入,並對這些輸出結果進行著作權法意義上的「作品」保護,否則不但不會鼓勵使用者的創作熱情,反而會給整個社會帶來不可預估的權屬混亂。

3、從法經濟學角度分析

法律服務於社會生活,必然需要考慮經濟成本問題。可以預見的是,隨著AI技術越來越進步,未來將有越來越多的人類參與AI創作,也會有越來越多的人工智能生成內容產生並存於世間。如果都以「AI文生圖第一案」這樣簡單的確權要件,諸如:使用者輸入的提示詞是多是少、設定的參數是否復雜、使用者是否滿意或最終選定等作為裁判和考量的因素,那麽對未來數以千億、萬億甚至無法預估的數量級的人工智能生成內容的司法確權成本將會變得相當高昂,由此引發的侵權評估、侵權判賠等經濟成本也同樣不可估量。因此,從法經濟學角度上看,司法不宜將著作權法意義上的「作品」認定和確權門檻設定得過於寬松。

4、從法律的穩定性和規則的可預期性分析

法律具有天然的滯後性,一是因為社會生活無時無刻不在發展變化之中,立法者在立法當時不可能預知到未來的一切變化;二是為了保護法律的穩定性以及法律後果的可預見性,立法不可能朝令夕改、反復無常。立法的滯後性尚且如此,司法更甚。當傳統的著作權法理論與新興的科學技術的發展不相匹配的時候,在著作權法關於「作品」的保護規則能否套用於人工智能生成內容這一問題上仍有大量疑惑未解,且有眾多邏輯推論不通順的情況下,作為解決糾紛的最後一道防線,司法更應穩居幕後采取謙抑、被動的裁判方式,而不是「沖鋒在前」。

在筆者看來,「AI文生圖第一案」具有相當的特殊性和不可復制性,導致該案判決本身也不具有代表性或可預期性。該案判決書中提到原告在使用Stable Diffusion模型輸入20余個正向提示詞(Prompt)和130余個反向提示詞(Negative Prompt)後生成了基礎圖片(即第一張圖片),「其中,反向提示詞中的‘((3d,render,cg,painting,drawing,cartoon,anime,comic:1.2))’系其(原告)自行編輯外,其余所有的反向提示詞均系其(原告)直接復制於某論壇中使用者分享的提示詞內容。」一方面,根據常識,一般情況下,人工智能模型使用者如果事先沒有對最終的作品輪廓形成大概的認知時,不可能一次性想到並輸入如此之多的提示詞。另一方面,由於人工數據模型的數據量足夠龐大,其輸出結果往往也是根據概率統計,多樣性和不確定性極高,很少是唯一結果。因此,該案原告的操作過程很有可能是先形成「具象的表達」,然後倒推「非具象的思想」,即原告很有可能是根據輸出結果來逆向倒推要輸入的正、反提示詞。即使不是透過結果逆向倒推過程,130個反向提示詞中也有120多個詞是直接復制於某論壇中使用者分享的,原告自身在參與人工智能正向生成的過程中所付出的人類勞動是否構成著作權法「作品」意義上的「智力投入」和「智力成果」,仍然存在很大疑問。因此,該案的案情極為特殊,無法在一般意義上對未來社會形成充分的代表性和可預期性。

三、人工智能生成內容的法律定性的未來發展

哲學辯證法告訴我們,世界並非一成不變,任何事物都處於發展之中,所以我們也應該用動態、發展的眼光看待人工智能生成內容的法律定性和保護問題。

當前,人工智能技術發展日新月異,對人類社會和生活造成了極大的影響,甚至在某種程度上造成了恐慌或者崇拜。有的人認為,人工智能會提高人類工作效率和生活水平,應當大力支持。也有的人認為,人工智能隨著發展可能會完全替代人類甚至會消滅人類,應當嚴格限制或法律約束。這些看法都是片面的、不合邏輯的,沒有從整體、歷史、動態發展的角度去看待人工智能。人工智能本質上還是技術,是基於數學、演算法、算力等科學知識產生的新工具。技術最終都是服務於人類的,工具也不能替代人類,明白了這一點,就不必對人工智能的發展抱有不切實際的幻想或者不必要的恐懼。

新技術必然帶來新的社會問題,產生新的需要保護的利益或者權利。雖然法律相對於新技術的發展常常處於滯後的狀態,但利益和權利的保護仍然應當在法律穩定的框架內進行。故,筆者認為,人工智能生成內容的法律定性和保護規則應當由立法機關根據技術或社會的發展立法整體解決,而不宜由司法機關在某一個案中單獨解決。而在此之前,如果司法機關為了應對個案解決爭議,也至少應當采取謹慎和謙抑的態度,確立具有明確代表性和可預期性的裁判規則。

當然,如果未來人工智能技術已經發展到足以讓人類在參與創作的過程中表現出明顯的「智力投入」並產出「智力成果」,我們完全可以考慮對其直接適用著作權法關於「作品」和「作者」的保護規則,否則要麽創設新法,要麽對其適用反不正當競爭法進行規制,更為妥當。

註釋

[1] 法人或非法人組織作者僅為法律擬制的作者,並非嚴格意義上可以進行「智力投入」的作者,在此不予探討。

[2] 「智能」和「智力」的準確詞語意思,均來源於商務印書館2016年第7版【現代漢語詞典】第1692頁。

[3] 筆者註意到一則新聞報道:近期,美國最具影響力的媒體之一【紐約時報】在紐約南區法院向OpenAI及其投資人微軟公司提起侵犯版權訴訟,指控二者未經特許使用其數百萬篇文章以訓練人工智能模型,而這些聊天機器人現在與該新聞機構形成競爭,成為可靠的資訊來源。訴訟未明確提出具體的經濟要求,但稱被告應對與"非法復制和使用【紐約時報】獨特有價值的作品"相關的"數十億美元的法定和實際損害"負責,還要求被告銷毀使用【紐約時報】版權材料的所有AI模型和訓練數據。有業內人士分析稱,該案有可能是Open AI面臨的有史以來的最棘手AI版權訴訟,其最終裁判結果可能成為人工智能發展與版權保護的分水嶺,不僅將對美國人工智能的發展產生重要的影響,而且將對中國探索人工智能的保護規則產生積極價值。

(本文僅代表作者觀點,不代表知產力立場)

封面來源 | Unsplash