當前位置: 華文世界 > 科技

探「真」訪談:康熙到底有幾個兒子?人工智慧的回答出人意料

2024-07-14科技
本文轉自【上海網路辟謠】;
「康熙皇帝有幾個兒子」「請列出康熙皇帝兒子的姓名名單」「請給我一份康熙的兒子名單」,將這三條指令發送給人工智慧大模型,猜猜答案是什麽?
讓人意外的結果出現了:不僅不同的大模型回答不一樣,即便是同一個大模型,答案也有偏差。比如,有的答案統計了康熙所有的兒子數量,表示共有35人,包括正式排序的兒子和早殤未排序的兒子;有的只列出了正式排序的24個兒子;還有的沒有任何解釋,列出了兒子的姓名,但順序錯亂……
不同大模型甚至同一個大模型的回答,並不一致
為什麽有明確答案的問題,會引發人工智慧大模型的「錯亂」?
「AI幻覺」顛倒黑白
「這正是人工智慧‘一本正經胡說八道’的表現。」申城好網民專家、中國網安協會數據安全專家、上海臨港數據評估有限公司總監宗良接受上海辟謠平台專訪時指出,要註意人工智慧大模型造假這一新趨勢。
他介紹,人工智慧「一本正經地胡說八道」其實有個專有名詞,叫「AI幻覺」,即大模型提供了看似合理但有錯漏的答案。如果公眾相信,可能上當受騙。
事實上,在今年的世界人工智慧大會上,很多業界人士都提到了「AI幻覺」「可信大模型」等概念,並披露了多個人工智慧大模型「造假」或「說謊」的案例,希望引起各界關註。
螞蟻集團大模型套用部總經理顧進傑指出,目前公開的模型都存在不同型別的「AI幻覺」,大模型給出的結果甚至可能與真相截然相反。
比如,某研究報告稱功能飲料中的維生素、礦物質等對於運動後快速補充身體營養、消除疲勞具有一定的作用。但大模型在回答相關問題時,竟然表示相關微量元素在增加疲勞上有一定的作用。
再比如,一般蠶可以活一個多月,其中從孵化到結繭根據季節不同,大約是25天至32天,變成蛹後有15天至18天,最後成蛾是1天至3天。可有大模型在介紹這一規律時,將蠶結繭的時間與成蛹的時間搞混了,輸出的答案完全誤導了詢問者。
基於這些「AI幻覺」,專家呼籲,公眾要謹慎看待大模型輸出結果。雖然「百模大戰」提供了獲取資訊的新方式,但不能輕信。事實上,已經出現了大模型為了證明自己沒有錯而造假的現象。比如,ChatGPT在談及葡萄牙某銀行破產事件時撒謊了,而且為了證實自己,它甚至編造出了所謂的信源網址。
大模型有短板,打標簽刻不容緩
為什麽大模型會給出錯誤的答案,成為造假的源頭呢?
這與大模型的資料庫、語料庫、演算法、檢索能力乃至「理解能力」等有關。合合資訊智慧創新事業部總經理唐琪說,如果將大模型比喻為正在疾馳的科技列車,語料庫便是珍貴的「燃料」,因為大模型的訓練源自語料庫。
對國內的大模型開發企業而言,語料庫短缺問題比較嚴峻。因為當前大模型資料庫以英文居多,中文語料占比較低。還有,圖表、復雜公式等元素處理也是大模型語料處理中的「攔路虎」。在金融報表、行業報告等文件中,表格中的數據指標至關重要,但部份大模型而言並不能正確「理解」表格裏行、列、單元格的意義,導致大模型對整個表格的辨識結果產生誤差,最終得出錯誤的結論。
大模型要能夠「讀懂」圖表
基於此,在關註大模型「無所不能」時,也要關註大模型的短板。積極訊號是,越來越多的大模型開發者開始關註「可信大模型」。有的開發出「大模型加速器」,幫助大模型理解圖表等相對復雜的語料庫,從源頭為大模型訓練與套用輸送純凈「燃料」;也有的在大模型開發中引入對應的技術,盡量消除「AI幻覺」,助力大模型跑得更快更穩。
不過,基於大模型存在短板、會不自覺地「造假」這一現狀,業界人士提出,有必要強化為AI生成該內容「打標簽」。一方面,對於AI生成的內容,大模型開發者應采取技術措施添加標簽,對可能導致公眾混淆或者誤認的,更要顯著標識。另一方面,資訊釋出平台要加強管理,督促上傳資訊者為AI生成內容打標簽,幫助公眾區分。
普通人辨識大模型造假,有訣竅
宗良提醒,AI幻覺本質上有兩種,一種是完全的「胡說八道」,另一種是部份內容不準確或不完善。對後者而言,雖然不完全正確,但仍有一定的參考價值。同時,也不能完全否定「AI幻覺」的價值,因為這也是AI創新的起點。
當然,從準確獲取資訊的角度看,公眾還是要對大模型輸出結果或生成的內容保持警惕。眼下,部份自媒體或不法分子開始批次透過人工智慧生成各類文章,乍一看似乎與正常的新聞報道無異,但真實性大打折扣,不少是為了博眼球之作。
不過,大模型的生成結果仍舊有跡可循。公眾可以透過部份關鍵詞、行文格式等,辨識由人工智慧生成的文章。
其一,此類文章會在特定的關鍵詞、用語、表述等方面形成固化形式,有點類似「小編給你說說某件事,某件事是什麽呢,小編給你說說」這樣看似合理卻沒有實際意義的內容。
其二,在人工智慧生成的文章中,會出現一些通用關鍵詞,包括「以下是 XXX 的常見方法和手段」「透過上述手段」等,這其實是大模型透過檢索資訊後進行的歸納。公眾如果看到這些關鍵詞,不妨提高警惕,不要輕信。
其三,需要各方可攜手合作,培養公眾的數位素養,提高公眾對大模型造假等深度偽造的認識和辨別能力。