當前位置: 華文世界 > 科技

從AI焦慮者到AI的擁躉者,旁觀美國AI技術套用的跨越式發展

2024-02-14科技

前幾天寫了幾篇關於AI技術套用的小文章,引發了網友質疑媚外的不適感,大過年的給一部份網友添堵,很過意不去。

其實在過去一年裏,AI技術在美國已經沒有什麽爭論了,估計大夥兒沒功夫爭論了,倫理問題、安全問題、失業問題都頂不上賺錢的問題。主要都忙著做套用,忙著做專案報告好扯旗招兵。

但如何讓普通人,讓一些對AI技術並不精通的門外漢進入這個領域,真正把外界的生產力代入AI平台,美國人還是有很多奇思妙想。

威蘇維古卷殘本

即使會引發部份網友的不適,但筆者還是認為寫出來會有啟發意義。

去年曾去加州大學拜訪一位華裔教授,閑聊時提起了在加州大學很火的「維蘇威上古卷軸」挑戰。

「維蘇威卷軸」是十八世紀發掘龐貝古城時出土的重要羅馬文獻。但因為是書寫在紙莎草上,發現時損毀嚴重,大量粘連在一起,很多部份已經破碎,特別是手寫的文字大多模糊不清,所以兩百多年來一直沒有被破解。

對古卷的全像掃描

大約二十年前,堪薩斯大學和加州大學的兩位教授,提出了用透視、斷層掃描和電腦輔助復原的方式破解維蘇威卷軸的計劃,但受限於當時的技術手段,雖然分解出了一些字元,但離真正破解卷軸還差距甚遠,維蘇威卷軸的內容也成了歷史懸案。

但隨著AI技術的興起,2023年,一個著名的AI科創投資人弗列特曼,提出了用AI技術破解維蘇威卷軸,並借此推進AI技術套用的構想,但為了解決AI技術人員不懂古文字破解,專業歷史研究者不懂底層技術的難題,弗列特曼推出了維蘇威挑戰賽。

這個挑戰賽弗列特曼拉來了一百萬美金的獎金。能夠將維蘇威卷軸內容破譯最多的團隊,將最終得到七十萬美金的獎勵。比賽會分為三個階段:破譯團隊的組建、AI模型的搭建、專案策劃報告為第一階段;AI程式的執行和初步成果展示為第二階段;古卷破解結果和相關論文為第三階段。

這三個階段,每個階段都會設定獎金發放,支持團隊購入更好的器材,租用更大的雲空間,招募更專業的合作者。

但挑戰賽對參賽隊伍有一個重要的要求,就是公開AI套用的底層程式碼,供所有人共享。

華裔教授告訴我,加州大學有十幾個由學生組成的團隊參加了比賽,基本都是電腦專業和考古專業的組合,目前進入到最後階段的還有兩支隊伍幸存,但之前被淘汰隊伍的成員也會加入到這兩支隊伍中,使每支隊伍都膨脹到十幾人。

教授也沒有想到挑戰賽的影響力會這麽大,全國參與的高校超過百所,來自全球三千多名參賽者組成了五百多支隊伍。最關鍵的是很多隊伍還找到了額外的贊助。

可能是比賽要求參賽隊公開原始碼的原因,這個比賽吸引了大量矽谷科技公司的興趣和關註,他們不但給參賽隊提供器材、技術、研究場地的支持,還提供了大量研究經費。

甚至有不少初創的AI技術公司直接下場,安排員工與一些歷史學家、語言學家組隊參賽。在這些公司看來,沒有什麽比參與實際研究專案,更能提升技術研發實力的。

一支來自加州大學的參賽隊伍也是不負眾望,首戰告捷。他們利用AI技術透過對掃描影像的分析和比對,成功分離出了不同書寫墨水每次使用時的細微差異,從而對已經上下粘在一起的古卷頁面成功進行數碼建模和分離,文字的排列順序也得到準確印證,為所有隊伍進一步的修復破譯工作打下了堅實基礎,也因此獲得了比賽組委會的裏程碑貢獻獎,贏取了一筆額外獎金。

從教授朋友的介紹中,我不難聽出他對活動的贊賞。在教授眼中,困擾技術創新的主要因素就是巨大的人力投入、時間投入、資金投入,最終的進展只有一點點。

而弗列特曼創辦比賽的意義則在於他把更廣泛的,數量龐大的人才短時間集中在了一起,讓他們得以組建各個能創造驚喜的團隊,並且讓更多的AI技術人員意識到技術更廣泛的套用和方法。

歷史最久遠的紙莎草古卷

最吸引人的地方則在於,弗列特曼創造了一種可以相互促進、補充、共享的開發模式,讓原本成功率很低的小機會變得驚人而遠大。

只可惜那次的拜訪恰好在周末,筆者沒能進入學校實驗室,觀摩那兩支隊伍的實際操練。

就在幾天前,筆者意外地看到,維蘇威卷軸挑戰賽結束了。最終的獲勝者挺讓人意外,並不是呼聲最高的加州團隊,而是一支僅有三人,卻來自三個不同國家,而且三個成員從未面對面工作的神奇團隊。

這支隊伍的成員配備與其他隊伍並無太大差異,一名擅長電腦編程、一名對羅馬歷史和文字有精深研究、一名則擅長影像處理、三維建模。

但仔細分析這支獲勝隊伍,還是能發現他們的特殊之處。那名擅長編程的,雖然還是在校大學生,卻有著豐富的工作經驗,他一直在馬斯克的SpaceX實習,因為表現突出,還曾組建過專項的研發團隊,既懂管理、能團結隊員,又富有創新精神,專業能力還強,是個少有的技術型管理人才。

另一位技術大拿來自柏林大學,自己卻是一位埃及人。可以說對起源於埃及的紙莎草文獻不但熟悉敏感,還有一種異於常人的情感紐帶。而他的專業是機器人,對於AI的理解、套用有他獨特的認識。

第三位成員來自蘇黎世大學,不但精通多種古文字,更難的是因為長期的專業研究,他有自己的門路可以拿到大量歐洲博物館中古文獻的數碼資料,很多是沒有對外公開的。這能夠讓AI閱讀學習更多更全面的專業資訊,有助於AI能力的提升。

可能也是因為這些特質,這三個完全在網上認識,從未面對面工作的參賽者組成了團隊。他們的AI軟件率先辨識出了第一個完整單詞,為後續破譯打下堅實基礎。

他們創造性的發現古卷的撰寫者並非一人,至少有三人參與,並分析出了三人的筆跡習慣,制作了屬於三個人的手寫字母表,這個發現,讓更多粘連在一起的模糊文字被分解出來。

他們最主要的貢獻就是AI軟件的辨識效率,因為前期的大量學習,特別是對於類似古卷拼接、辯識和破解資料的學習,他們的軟件已經成為這個領域最為強大的智能存在。

這個團隊雖然最終奪冠,但依舊只破解出不到10%的古卷內容,破解和復原工作還將繼續下去。至於大家所好奇的古卷內容,似乎沒有給公眾任何的驚喜,如果一定要對內容下定義,維蘇威古卷更像是一本古羅馬菜譜和宴會指南。

從破解出的內容看,一多半內容主要記載了羅馬宴會經常用到的食物以及加工方法,一小部份記載羅馬宴會的禮儀和民俗。

埃及的紙莎草古卷

不過想想龐貝時期羅馬人的生活方式,維蘇威古卷的記錄重點也能讓人理解。

不過這個團隊不但得到了七十萬美元的最終獎金,還獲得了弗列特曼的工作邀約,他們將加盟弗列特曼投資的一家AI技術服務公司,得以真正成為面對面的團隊。

只是相關的新聞並沒有提及弗列特曼的公司名稱,更查不到這家公司技術研發方向,很多資訊提及弗列特曼本人與美國軍方有大量合作,可能也是這個原因,很多資料不會公開。

著名的死海古卷

於是網絡上流傳出一個新版本的都市傳說:維蘇威挑戰賽只是整個計劃的前端,目的就是確定一批專業人才,並訓練出具備專業思考能力、運算能力的人工智能,後端則是為破解大量懸而未決的史前文明遺留的圖形文字做準備。

更有甚者提出弗列特曼大量組建AI團隊,是為了破譯美國政府回收的,越來越多的不明飛行物殘骸,以便進行逆向工程服務。

但無論真相如何,在美國如火如荼的AI技術研發與套用服務全面展開,是不爭的事實,它至少說明四個重點。

腓尼基古卷字母表是古文字破解的基礎文本

第一,AI是未來科技決勝的制高點,是未來社會的核心生產力,這已經成為共識。

第二,在未來AI的發展和套用過程中,依舊需要大量的人力,只是人類發揮其價值的方式發生變化,各個領域的專家依舊是稀缺資源。甚至AI創造的工作崗位遠遠超過被替代的。

古卷的數碼化重構

第三,AI技術將人類從繁瑣的重復性勞動、試錯性勞動中解放出來,反而讓人類更容易聚焦於思想、方向、借鑒和前瞻性判斷,從而實作效率的躍升與生產力的解放。

第四,AI技術歸根結底還是人類的工具,只是這種工具不再追求共性和統一性,相反可以完全適配於使用者個人的需要,因此在未來的競爭中,核心人的核心競爭作用反而會更加明顯。