探「真」訪談：康熙到底有幾個兒子？人工智慧的回答出人意料

2024-07-14科技

本文轉自【上海網路辟謠】；

「康熙皇帝有幾個兒子」「請列出康熙皇帝兒子的姓名名單」「請給我一份康熙的兒子名單」，將這三條指令發送給人工智慧大模型，猜猜答案是什麽？

讓人意外的結果出現了：不僅不同的大模型回答不一樣，即便是同一個大模型，答案也有偏差。比如，有的答案統計了康熙所有的兒子數量，表示共有35人，包括正式排序的兒子和早殤未排序的兒子；有的只列出了正式排序的24個兒子；還有的沒有任何解釋，列出了兒子的姓名，但順序錯亂……

不同大模型甚至同一個大模型的回答，並不一致

為什麽有明確答案的問題，會引發人工智慧大模型的「錯亂」？

「AI幻覺」顛倒黑白

「這正是人工智慧‘一本正經胡說八道’的表現。」申城好網民專家、中國網安協會數據安全專家、上海臨港數據評估有限公司總監宗良接受上海辟謠平台專訪時指出，要註意人工智慧大模型造假這一新趨勢。

他介紹，人工智慧「一本正經地胡說八道」其實有個專有名詞，叫「AI幻覺」，即大模型提供了看似合理但有錯漏的答案。如果公眾相信，可能上當受騙。

事實上，在今年的世界人工智慧大會上，很多業界人士都提到了「AI幻覺」「可信大模型」等概念，並披露了多個人工智慧大模型「造假」或「說謊」的案例，希望引起各界關註。

螞蟻集團大模型套用部總經理顧進傑指出，目前公開的模型都存在不同型別的「AI幻覺」，大模型給出的結果甚至可能與真相截然相反。

比如，某研究報告稱功能飲料中的維生素、礦物質等對於運動後快速補充身體營養、消除疲勞具有一定的作用。但大模型在回答相關問題時，竟然表示相關微量元素在增加疲勞上有一定的作用。

再比如，一般蠶可以活一個多月，其中從孵化到結繭根據季節不同，大約是25天至32天，變成蛹後有15天至18天，最後成蛾是1天至3天。可有大模型在介紹這一規律時，將蠶結繭的時間與成蛹的時間搞混了，輸出的答案完全誤導了詢問者。

基於這些「AI幻覺」，專家呼籲，公眾要謹慎看待大模型輸出結果。雖然「百模大戰」提供了獲取資訊的新方式，但不能輕信。事實上，已經出現了大模型為了證明自己沒有錯而造假的現象。比如，ChatGPT在談及葡萄牙某銀行破產事件時撒謊了，而且為了證實自己，它甚至編造出了所謂的信源網址。

大模型有短板，打標簽刻不容緩

為什麽大模型會給出錯誤的答案，成為造假的源頭呢？

這與大模型的資料庫、語料庫、演算法、檢索能力乃至「理解能力」等有關。合合資訊智慧創新事業部總經理唐琪說，如果將大模型比喻為正在疾馳的科技列車，語料庫便是珍貴的「燃料」，因為大模型的訓練源自語料庫。

對國內的大模型開發企業而言，語料庫短缺問題比較嚴峻。因為當前大模型資料庫以英文居多，中文語料占比較低。還有，圖表、復雜公式等元素處理也是大模型語料處理中的「攔路虎」。在金融報表、行業報告等文件中，表格中的數據指標至關重要，但部份大模型而言並不能正確「理解」表格裏行、列、單元格的意義，導致大模型對整個表格的辨識結果產生誤差，最終得出錯誤的結論。

大模型要能夠「讀懂」圖表

基於此，在關註大模型「無所不能」時，也要關註大模型的短板。積極訊號是，越來越多的大模型開發者開始關註「可信大模型」。有的開發出「大模型加速器」，幫助大模型理解圖表等相對復雜的語料庫，從源頭為大模型訓練與套用輸送純凈「燃料」；也有的在大模型開發中引入對應的技術，盡量消除「AI幻覺」，助力大模型跑得更快更穩。

不過，基於大模型存在短板、會不自覺地「造假」這一現狀，業界人士提出，有必要強化為AI生成該內容「打標簽」。一方面，對於AI生成的內容，大模型開發者應采取技術措施添加標簽，對可能導致公眾混淆或者誤認的，更要顯著標識。另一方面，資訊釋出平台要加強管理，督促上傳資訊者為AI生成內容打標簽，幫助公眾區分。

普通人辨識大模型造假，有訣竅

宗良提醒，AI幻覺本質上有兩種，一種是完全的「胡說八道」，另一種是部份內容不準確或不完善。對後者而言，雖然不完全正確，但仍有一定的參考價值。同時，也不能完全否定「AI幻覺」的價值，因為這也是AI創新的起點。

當然，從準確獲取資訊的角度看，公眾還是要對大模型輸出結果或生成的內容保持警惕。眼下，部份自媒體或不法分子開始批次透過人工智慧生成各類文章，乍一看似乎與正常的新聞報道無異，但真實性大打折扣，不少是為了博眼球之作。

不過，大模型的生成結果仍舊有跡可循。公眾可以透過部份關鍵詞、行文格式等，辨識由人工智慧生成的文章。

其一，此類文章會在特定的關鍵詞、用語、表述等方面形成固化形式，有點類似「小編給你說說某件事，某件事是什麽呢，小編給你說說」這樣看似合理卻沒有實際意義的內容。

其二，在人工智慧生成的文章中，會出現一些通用關鍵詞，包括「以下是 XXX 的常見方法和手段」「透過上述手段」等，這其實是大模型透過檢索資訊後進行的歸納。公眾如果看到這些關鍵詞，不妨提高警惕，不要輕信。

其三，需要各方可攜手合作，培養公眾的數位素養，提高公眾對大模型造假等深度偽造的認識和辨別能力。