他們自己寫的畢業論文，被認定長著一張AI的臉

2024-07-22科技

看到AI檢測系統裏，畢業論文成片的紅色和黃色時，舒然感到「欲哭無淚」。她在心裏反問自己：難道我長得這麽像AI嗎？

在舒然兩萬三千字的論文中，有幾十段文字被檢測出「中風險」和「高風險」。舒然解釋，這意味著自己的畢業論文雖是原創的，卻因為「AI率較高」無法達到學校論文過審的要求。

隨著AI的流行，不乏學生會在論文寫作時借助AI生成。根據一些高校的官網訊息，針對2024屆畢業生，這些學校首次釋出了有關AIGC（生成式人工智能）檢測的通知，明確學生在進行畢業設計（論文）時，應嚴格遵守學術規範和學術道德，避免過度依賴智能生成內容，確保畢業設計（論文）的獨立性和原創性。

接受采訪的學生們都認為，AI檢測某種程度上的確可以防止學生用AI代寫論文，但是目前的AI檢測功能尚不成熟。「很難理解它是怎麽判斷為AI寫作的，因為就算是人工寫作，或者經過修改，也會再次檢測成AI代寫。」舒然說，用科技制裁科技的結果，會導致跟論文的要求相反。

對於那些被誤判為AI寫作畢業論文的學生，機器反饋給他們一個數碼，他們沒有申訴途徑，只能按照機器的執行邏輯修改。一個明顯的悖論是，當人工智能越來越像人類時，人類自己寫的句子也越來越像人工智能。此時，用AI檢測是否使用AI代寫，他們的論文被誤判為AI代寫的可能性就越高。

從「中風險」改到「高風險」

今年4月底，即將大學畢業的舒然和導師討論後，定下了自己畢業論文的題目。

一個月後，舒然開始寫論文初稿。撰寫論文期間，她已經進入一家公司實習。每天下班後，她趴在電腦前絞盡腦汁，寫到半夜才休息。周末兩天，她把所有時間都投入到論文寫作中。

因為提前和導師商量好了論文的結構框架，寫作過程中，舒然的思路較為清晰和順暢。除此之外，導師對她的論文格式，包括目錄、字型、表格的線條等都提出了更細致的要求。

大概過了半個月，她寫完論文初稿。按照學校的要求，她的畢業論文字數要在兩萬以上。一遍遍修改後，舒然的論文字數停留在兩萬三千字。

學校的另一個要求是，除了一般的查重外，學生需使用一款叫「格子達」的AI工具作為論文參照檢測系統，檢測的結果必須是「低風險」。

舒然透過上網查詢得知，這款軟件能夠提供論文查重、格式檢測、格式校正、論文管理等功能。論文查重主要透過與期刊數據庫比對，找出論文中內容的重復率。

不同的查重系統演算法和數據庫大小不一樣，比如知網查重的規則是13個字元，即6.5個字連續重復就會被標紅。而AI檢測的目的在於辨識出哪些內容是由AI生成，透過分析語言風格、檢測重復內容、語法和邏輯進行判斷。

寫完論文初稿一個星期後，舒然發給導師。導師提出修改意見後，她從標題到框架全部「人工」修改了一遍，直到對自己滿意為止。在答辯前兩周，她將論文送出到AI工具裏檢測。

在舒然送出之前，她的一個室友先進行了AI檢測。結果是查重率13%，AI檢測「中風險」。室友對此結果並不意外，她告訴舒然，自己的論文有一部份是AI代寫的。

當時舒然覺得「還挺新奇」，但她心想，這樣的論文肯定重率高，自己的論文都是一個字一個字寫的。當舒然把論文送出後，出現在她眼前的查重率只有1%，但AI報告也是「中風險」。

這意味著，她必須降AI率，從「中風險」降到「低風險」。

和舒然一樣，四川大學生林天樂的畢業論文也被判定為AI代寫。今年畢業前兩個月，林天樂突然接到學校要求查AI率的通知。交論文截止日期的前一天，他才知道學校要求學生使用維普論文檢測系統，系統顯示，可以用AI語言模型檢測AIGC實作快速、準確辨識學術文本中的AI生成內容，可有效辨識文本是否部份或全部由AI模型生成，檢測結果與論文質素無關，僅表示論文中內容片段存在AI生成可能性的概率。

林天樂學校要求，AI率要低於30%。超過這個比例，論文盲審不能透過，就無法畢業。他上傳論文後，查出來的結果是37%。林天樂表示，標成AI的那些內容，都是他自己寫的。

在這之前，他已經在知網上查過一遍，查出來的重復率是百分之零，所以他對自己的論文比較放心。直到要交初稿的當天，老師建議他再加新的內容進去，他又繼續修改，到下午才定稿。「感覺自己這麽努力，到交之前還手忙腳亂， AI率卻被判為37%，內心挺氣憤的。」

林天樂在社交平台上吐槽檢測結果。本文圖片均為受訪者供圖

因為已經保送了研究生，林天樂對自己的論文要求較高。每天早上9點，他就跑到實驗室打卡寫論文，一直寫到晚上八九點，有時候熬夜寫到十一二點。持續了一個學期，論文寫了近四萬字。

原本信心十足，讀博士的師兄也誇贊他論文內容豐富，圖表畫得好看，查重率從來沒超過3%，卻被檢測出AI代寫，林天樂心情跌落谷底。

你的AI率降下來了嗎？

剛開始改論文，舒然根據軟件裏標紅和標黃的提示，自己琢磨修改。對於那些跟其他內容相似的句子，「看著它有點像AI」，便逐字逐句地改。

她念的是國際經濟與貿易專業，論文中涉及不少專業術語的概念解釋。但令她苦惱的是，這些固定的解釋最容易被AI系統標紅，而她又無法「創造出一個新的概念」。

她的具體修改方式是，用同義詞替換，或者調整一下句子的順序，或者用一些更「高級」的詞匯，以此對抗「AI給出的機械和低階的詞句」。但她沒想到，再次檢測的結果竟變成了「高風險」。

舒然內心徹底「破防」。她並不知道其中的演算法和規則，只知道軟件會標出不同的風險段數，標紅的是高風險，標黃的是中風險，標綠的是低風險。第一次檢測結果中，她論文中的「中風險」有35段，改完之後變成了五十幾段。

舒然修改論文後變成「高風險」。

論文被判成「高風險」之後，舒然先冷靜了一個晚上。第二天，她開始上網到處搜尋降低風險的方法。剛開始，她嘗試了幾款可以降AI率的AI工具，「但都沒啥用。」

之後，她又搜到一些大學畢業生降AI率的經驗分享帖，說要去掉論文中「首先」、「其次」、「和」等字詞，以及調換語句和語序等等。她用這種方法再次修改了一遍論文，論文又變回到「中風險」。

改了一天後，又回到起點。舒然覺得這樣的修改方法太慢，於是繼續上網搜尋。這次，她透過提煉其他人降AI率的經驗，總結出一句她背得「滾瓜爛熟的法則」，即「復雜變簡單，正話反說，主動變被動，簡單變復雜」。

距離交論文定稿的時間只剩下兩天，舒然和室友們的論文都被判為「高風險」或者「中風險」。「她們有的是用AI代寫的，有的是從別人論文裏面抄的，也有自己寫的」。舒然說，她們檢測結果相似，都是查重率不算很高，但是AI率很高。

熬到淩晨三點，那個晚上，宿舍裏彼此間說得最多的話是：「你的AI率降下來了嗎？」

學校雖然提供了一次免費的檢測機會，但舒然想用在最終稿上，因為檢測報告一出來，系統會直接送出給老師。她先後自己花了200多塊錢，購買了四次檢測機會。

她感覺論文像做了一次次體檢，「檢查出來都是病。」報告很詳細，「甚至可能就幾個字重了，也會標紅。」

降AI率的過程中，舒然腦中盤旋的一直是導師的話：論文過不了，會影響畢業。答辯之後還會抽查，抽檢不過關的，後果很嚴重。

天快亮的時候，舒然不記得是第幾次改完整篇論文。再次檢查，雖然報告上仍有幾段顯示是「中風險」和「低風險」，但整體結果是她無比期待的「零風險」三個字。

她舒了一口氣，迫不及待跟同學分享自己降AI率的方法，熬夜幫室友的論文改至「低風險」。「室友開心得不得了，說你就是我們宿舍的神。」

但是舒然感覺，她把室友的論文也改得「難以入目」。為了降AI率，她和其他同學一樣，不再顧及論文內容的通順和流暢。不過，最後她還是順利透過了答辯。

和舒然一樣，林天樂也上網搜尋了各種降AI率的方法。同學建議他用AI軟件降AI率，他拒絕了。自己又重新寫了三遍，最後一氣之下直接「爆刪」。

但論文查出來的AI率仍有30.13%，他覺得自己可能要延期畢業了。他記得那個夜晚，班裏幾乎所有同學跟他一樣，因為AI率通宵熬夜修改論文。

起初，學校通知是這天零點前交稿，由於AI檢測系統不穩定，很多同學沒有成功交上去，學校不得不把截稿時間推遲到第二天的中午12點。

林天樂後來降AI率的心得是，少用連線詞，句中多用逗號，多個短句共用一個主語。

為了更快速和高效，被檢測標紅的部份，林天樂全部刪掉，直接再重寫一遍。改了三遍之後，論文中仍然有標紅的地方，他繼續覆寫一遍，最後AI率只降了不到7%。

截稿時間越來越緊迫，他只能繼續刪掉標紅的幾千字。他知道這對論文內容有一定影響，「觀感沒有之前那麽好，但是沒有辦法，至少能順利畢業了。」

「故意暴露人類的缺點」

當同學問舒然降AI率的方法時，她半開玩笑地說，其實就是「故意暴露一些人類的小缺點」，比如寫得沒那麽通順。

降AI率成功的喜悅沒有持續幾分鐘，舒然開始感到失落。自己用盡心思寫出來的論文，經過「縫縫補補」，最後變得「支離破碎」，並沒有達到她想要的目標。

這也讓她思考，當AI越來越智能化，它寫出來的東西「很高級、很專業，越來越接近人類時，又用AI檢測系統讓我們去降低AI率，那不就是把我們自己變得不像人類了嗎？」舒然覺得，這是一個悖論。

舒然論文修改前被AI標黃。

舒然論文修改後不再被標黃，但語句變得不通順。

針對被誤判的行為，受訪大學生們的共同疑問是，程式是怎麽判定的？「很多人用AI是為了將自己的口語變得學術化，現在為了避檢，卻要故意將學術化語言改得更口語化。」浙江一所高校的大四畢業生古思琪說。

去年12月，古思琪完成了畢業論文的開題報告。今年2月，她開始寫初稿。查閱資料、構思和寫稿，大概花了兩周時間，她把論文初稿交到老師手中。之後再根據老師的建議修改，一篇本科畢業論文便算完成。

古思琪就讀的學校今年也有新的規定。不同於往年的紙質版定稿，學生需透過知網系統上傳論文。定稿之後，到了5月，學校才通知學生，要查AI率。古思琪心想，我都寫好了，不會再改了吧。「老師只說如果評優的論文（AI率）需要在10%以下，但沒有說合格的論文AI率要低於多少。」古思琪回憶。

論文上傳到檢測系統後，古思琪發現，她自己寫的某一段話，「一個邏輯性很強的結論」，卻被認定為是AI寫的。雖然沒有具體的比例要求，但老師說盡量把論文的AI率降下來。降之前，古思琪論文的AI率是38%。

於是她不得不把邏輯詞去掉，讓前後句子的關聯度變弱，或者調換段落順序，或者把幾段內容壓縮成一段。打亂之後，「反而更像是機器寫的了。」不過改了半天後，論文的AI率的確降了下來。

但是古思琪覺得自己論文中「亮點的內容」，最後都變得「平平無奇」。「這讓我看論文的時候心裏很難受」。

她聽說可以用AI降AI率後，也嘗試過用ChatGPT和其他軟件。當時她想清除關聯詞的部份，但最後的結果和她自己想寫的「完全無關」。

古思琪覺得，「AI的邏輯和人的邏輯有一定的差距。它會帶有一些人的想法，但是沒有我們人寫得那麽順暢，看著很別扭。」她說，AI只會抓住一些關鍵詞，辨識論文是否是AI寫的。所以，用AI來改AI率就顯得很矛盾。

反反復復修改之後，林天樂已經降低了自己的「學術要求」。強行改變行文邏輯，也讓他感到「錯亂」。「從小到大一直使用的連線詞，可以讓文章比較通暢，現在都不能用，好像已經變成AI專屬。」

雖然最後林天樂的論文如願以償被評為優秀畢業論文，但他仍有種無處訴說的冤屈感。「根本沒用過AI寫，難道要讓人承認沒做過的事情嗎？」他為此難過了幾天。

科技「制裁」科技

一篇論文生產送出的前後，AI作為使用的輔助工具，再用作檢測AI代寫的系統，之後再成為降AI率的工具，「AI主導了一切」，林天樂說。

林天樂的專業是自動化方向，有時他會使用AI詢問某句程式碼的相關含義，「AI會給出比人更加耐心和詳細的回答」。他認可AI是一種實用工具。但是對於透過AI查論文的AI率，他覺得檢測標準和準確率並不能令人信服。

林天樂曾將自己的困惑告訴論文指導老師。老師覺得，檢測系統目前的確不太智能，但學校已有相關規定。除了鼓勵他加緊修改外，也沒有其他辦法。

林天樂就讀的學校今年是第一次進行AI檢測畢業論文。雖然系統還在公測階段，但已經開始使用。「之前不是說【學位法】要檢測AI，但是最終法律把AI那條刪掉了。因為它本來就只能根據簡單的措詞來判斷，而且是疑似。」

他指的是在2023年8月審議的【中華人民共和國學位法（草案）】中，草案明確學位論文或者實踐成果存在抄襲、剽竊、偽造、數據造假、人工智能代寫等學術不端行為的，經學位評定委員會審議決定由學位授予單位撤銷學位證書。

但在今年4月最終頒布的【學位法】中，人工智能代寫並沒有被納入學術不端行為的考量。「不過一些學校目前已經開始進行AI檢測」，重慶一所高校的老師說，高校引入「AIGC（生成式人工智能）檢測服務系統」，多是出於學術誠信的考慮，確保論文的原創性，並以此抵制人工智能代寫論文的行為。

部份學校的通告顯示，人工智能工具僅可用於文獻檢索、數據處理等輔助工作，嚴禁直接套用於論文撰寫。但是，不同學校對於人工智能生成內容比例的要求並不相同。

在拼命降AI率的過程中，古思琪有同樣的困惑：「AI的判斷，是準確和可靠的嗎？」

她聽有同學說自己在致謝裏感謝某位老師的話語，也被標成AI寫作了。她不知道自己的論文被判為AI代寫的原因，改起來也無從下手。最初改完之後一查，只下降了1%。

最後有幾段內容，她實在不知道怎麽修改，也不能刪掉。於是她用降重的方法，先轉譯成英語，再轉譯回中文，AI率最終降到學校要求的15%。她身邊有同學為了降AI率，先把中文轉譯成愛沙尼亞語，再轉譯成中文。

古思琪同組內有一個同學，論文的引言和致謝都是AI寫的，就這樣直接發給老師後，老師把學生「痛批」了一頓，「這樣的行為肯定是學術不端。但是如果自己的想法大於人工智能的參與，AI就只是一種工具。」

在學校要求開始查AI率之後，古思琪跟導師交流過。她的導師平時很喜歡使用AI輔助教學，也不限制學生使用AI。導師覺得使用AI能幫助學生拓展思維，「比如AI給出了三種想法，如果你能不限於AI的想法，拓展出四五種，就掌握了和AI互動的主動權。」

未來，古思琪打算讀研究生，她認為之後的論文可能都會進行AI檢測，檢測是必要的，「因為現在的確有很多人直接用AI代寫」。但是她自己寫的內容，也被判定為AI代寫，說明系統還不完善。

六月，舒然透過了論文答辯，順利拿到了畢業證。畢業論文躺在她的電腦中。偶爾，她會回想起降論文AI率的「痛苦過程」，好像只是「稀裏糊塗」完成了一個任務。

對於那個判定她代寫的系統，她依然一無所知。