當前位置: 華文世界 > 科學

「我的論文被引次數,竟不如一只貓」

2024-08-26科學

文|王兆昱 徐可瑩

在學術界,論文被引次數和h指數是評價科研人員學術影響力的重要指標。然而,這些指標真的能夠做到公正、客觀嗎?

最近,美國西北大學的博士生Reese Richardson和英國劍橋大學的研究員Nick Wise就借一場黑色幽默實驗給出了答案——僅憑幾篇由「自動生成器」胡亂生成的論文,他們便讓一只名為Larry的寵物貓在谷歌學術上有了自己的賬號,成為「世界上被引最高的貓」。

一只貓是如何成為學者的。

揭醜「論文工廠」

在制造這場「人冠貓戴」的惡作劇之前,Reese和Nick看到了一則「論文工廠」廣告。

該廣告釋出於6月28日,它聲稱,可以幫助客戶增加在谷歌學術中的論文被引次數和h指數。兩位學者圍繞這則玄乎的廣告展開了調查。

廣告稱:「我們可以幫您大量增加被引次數。」

首先,該廣告附帶有一些「成功」 的案例。案例顯示,客戶谷歌學術主頁上的被引次數顯著增加。

其次,他們發現,在18位元「論文工廠」的老客戶中,有11位的谷歌學術檔案仍處於活躍狀態,還能對其進行存取。除2位客戶外,幾乎所有客戶都隸屬於印度的大學。

經「論文工廠」操作後,某客戶的被引次數翻了兩番,h指數翻了一番。

那麽,「論文工廠」具體是如何操縱這些指標的呢?Reese和Nick進一步調查發現,有些客戶的大量被引來自同一可疑期刊上的數十篇論文,這些論文結尾的參考文獻列表包含了很多壓根沒有在正文中被參照的文獻,這些被憑空硬塞進來的「參考文獻」自然就是客戶的論文。

還有更加明目張膽的方式——竟然有幾十篇以畢達哥拉斯(古希臘數學家)、伽利略(意大利天文學家)、泰勒(英國數學家)和柯爾莫哥洛夫(蘇聯數學家)這些已經去世的名人為作者的數學論文。

這些論文未發表在任何期刊或預印本伺服器上,只是作為PDF檔上傳到學術社交網站ResearchGate。它們由免費程式Mathgen隨機生成,乍看起來專業,但大部份內容都是胡言亂語。造假者還「貼心」地對論文摘要進行了修改,讓摘要包含與標題相關的文字。

由免費程式Mathgen隨機生成的論文。

以下是「論文工廠」幫助客戶增加被引次數的步驟:

1. 與客戶簽合約;

2. 用Mathgen自動生成幾篇無意義的論文(並將標題和摘要改為更符合引文語境的內容);

3. 把客戶的論文作為引文,隨意插入無意義論文中;

4. 將無意義論文上傳到ResearchGate;

5. 等待谷歌學術將無意義論文編入索引;

6. 祝賀客戶的「學術影響力」提高(同時還要「毀屍滅跡」,從ResearchGate上刪除無意義論文,但客戶的相關指標不會降低) ;

這些步驟無需成本,工作量小,而且可以無限擴充套件。Nick表示,用這種方法,任何人都可以成為世界上被引次數最多的人,甚至動物也可以。

「貓學者」的誕生

Reese和Nick決定做一次大膽的嘗試。

他們為Reese父母的寵物貓「Larry」設計了一個直白卻頗具學者氣質的人名「Larry Richardson」,並將貓咪同Reese父親的一張親密合影上傳ResearchGate作為它的頭像,供職機構填寫為Reese所在的美國西北大學。

「貓學者」Larry的頭像:與Reese父親的合影。

隨後,Reese便借助Mathgen,為「貓學者」Larry生成了12篇學術論文,Larry皆為唯一作者。此外,又生成了12篇並非出自Larry的論文,透過編輯修改,在參考文獻中把Larry所著的12篇論文全部羅列出來。如此一來,Larry就能一次性獲得144次被參照量,h指數可達到12。

那麽,整個過程都沒有引起相關責任方的警覺並加以阻攔嗎?有,但確實不多。

Reese在ResearchGate上傳Larry的相關資料時,被要求以學術郵箱建立個人檔案,這樣能夠免於填寫那些煩人的驗證步驟。按理說,Larry到這一步就該束手無措了。畢竟,這只小貓在西北大學連一個真正的工位都沒有,哪來的學術郵箱?

戲謔的事情出現了。帶有「northwestern.edu」字尾的電子郵件地址其實不難獲得,甚至可以在網上自行購買到。為證明這一說法,Reese在博文中甚至貼心地附上了相關新聞報道。

用學術郵箱填寫好個人資料後,Larry還需要上傳自己撰寫的論文。但這對一只貓背後的Reese而言更簡單,他只需要動動手指,在研究專案填寫欄下方點選「添加更多作者」按鈕,再手動輸入「Larry Richardson」即可。

至此,ResearchGate賬戶就被建好了,Reese和Nick只需靜待谷歌學術上的數據更新。

兩個星期後,Larry和Reese父親的臉出現在谷歌學術檔案上,其中赫然列出Larry的顯著工作,並指出「這位學者的被引次數達到132次,h指數為11」。

由於一些未知原因,最後顯示的被參照量和h指數並沒有Reese他們預想的那麽好。但Larry依然成為了世界上被引次數最多的「貓學者」,一舉「變身」為歷史上最具貢獻的貓科知識分子。

「貓學者」Larry的谷歌學術主頁。

兩位學者與他們的期望

Reese是西北大學阿馬拉爾實驗室(Amaral Lab)的一名博士研究生,專業方向為跨學科生物科學。值得一提的是,Reese擁有物理學和套用數學兩個學士學位,博士研究領域為計算生物學,是北美旗幟學協會的正式成員,還曾在芝加哥公共衛生局從事超過2年的公共服務工作,是位不折不扣的「交叉型」人才。

研究工作之外,Reese建立了自己的網誌網頁,定期釋出一些探討「科學可重復性」的案例研究,矛頭直指「論文工廠」「實驗造假」「研究欺詐」「撤稿汙名」等涉及科研誠信及公平的問題。

Reese Richardson。圖片源自西北大學官網

本次「惡作劇」的另一位關鍵參與者是Nick。

和Reese一樣,Nick也長期致力於對科研誠信等問題的公共討論。他的本職工作是劍橋大學的一名研究員,專業方向是工程學與流體動力學;另一重身份則是業內知名的「科學偵探」——透過每天查閱各類研究論文,發現潛在的學術欺詐行為,並對其進行舉報。

「在某些情況下,你不需要成為專家或在該領域工作就能發現問題所在。」Nick在美國物理學會網站的報道中說。三年來,在他的監督和檢舉下,一家出版商甚至撤回了850篇存在抄襲、參照不當等問題的論文。

Nick關註到,社交平台上充斥著很多來自「論文工廠」的廣告,出售已經被期刊接收發表的手稿的作者名額,部份廣告中會涉及論文標題。幾個月後在谷歌學術上搜尋這些論文標題,都與廣告互為印證。期刊的影響因子越高,作者名額的售價就越貴。

Nick 長期關註並追蹤「論文工廠」的惡劣行徑。與Reese的此次合作,也是為了進一步證明像ResearchGate這樣的科研服務網站和谷歌學術這樣的搜尋引擎在保障科學公平、研究誠信等方面,仍然存在巨大的漏洞與隱患。

Nick Wise。圖片源自劍橋大學官網

讓貓成為「高被引學者」,僅花費了兩位學者約1小時的時間。他們想透過這個嘗試告訴大家:由谷歌學術和ResearchGate計算出的量化評價指標或能被輕易操縱。

「為了使科學事業更加公平,我們應該完全拋棄被引次數、影響因子和h指數等量化評價指標。如果Google Scholar、Web of Science、Scopus和ResearchGate等不再向使用者提供這些指標,我們就可以朝著理想邁進一大步。不過,如果它們執意要保留基於引文的指標,至少應該讓指標不那麽容易被操縱。」Reese在一篇博文中寫道。

故事的後續更加有趣。

7月24日,谷歌學術刪除了貓咪Larry的所有原創論文和參照論文。至此,Larry將「世界上被引次數最高的貓」這個頭銜保持了一周。奇怪的是,谷歌學術並未對那些「論文工廠」造假的研究成果采取針對性措施。

只有Larry受傷的世界達成了。

Larry生活照。

資訊來源:

1.https://www.aps.org/apsnews/2023/06/nick-wise-fluid-dynamics-researcher

2.https://reeserichardson.blog/2024/07/18/engineering-the-worlds-highest-cited-cat-larry/

3.https://www.clare.cam.ac.uk/about/people/master-and-fellowship/college-research-associates/nick-wise

4.https://amaral.northwestern.edu/people/richardson/