當前位置: 華文世界 > 科技

AI:一場非線性的未來洶湧而來

2024-07-18科技
(本文作者重陽投資,秦朔朋友圈撰稿人)
7月6日下午,2024世界人工智慧大會在上海閉幕。本屆大會線下參觀人數突破30萬人次,全網流量突破10億,比上屆增長了90%,500余家知名企業和超過1500項人工智慧展品參展,50余款新品先發首秀,均創歷史新高。
大洋彼岸,6月11日淩晨,蘋果在2024年WWDC大會上正式釋出個人智慧系統Apple Intelligence,之後兩日蘋果股價大漲超過10%,巨象起舞。
而AI領域的「當紅炸子雞」——輝達,自2023年初至今漲幅超過7倍。這一切的驅動背後,正是大語言模型所帶來的新一輪AI浪潮。
正如比爾·蓋茲所言:「人們總是高估了未來一到兩年的變化,低估了未來十年的變革」。
經過一年多的學習和研究,市場對於AI行業已經有了比較充分的理解和認知。
那麽站在當下,我們又該如何看待其未來發展的趨勢?
01
要想回答這個問題,我們可能先要回顧一下AI的歷史。
從1950年,英國數學家艾倫·圖靈提出圖靈測試,到1956年達特茅斯會議上約翰·麥卡錫、馬文·明斯基、克勞德·夏農和內森尼爾·羅切斯特等學者正式提出「人工智慧」這個術語,人工智慧迄今也只是一個發展尚不足百年的年輕學科。
1986年,傑佛瑞·辛頓等學者發表關於反向傳播演算法的研究,為後來深度學習的發展奠定了基礎。
2012年,AlexNet在ImageNet影像辨識競賽中取得突破性成績,進一步證明了深度學習的潛力。深度學習的套用,使得影像辨識和語音辨識準確率得到大幅提升,人臉辨識開始走進千家萬戶。
2017年,Ashish Vaswani、Noam Shazeer等谷歌的科學家提出基於Transformer架構的模型,推動了自然語言處理的顯著進步,也開啟了這輪大語言模型的浪潮。
從語音-影像到語意,到最近的多模態融合,邊界的延展背後,是模型縮放定律和算力莫耳定律的持續有效,仍然看不到觸達天花板的跡象。
在互聯網時代,有一個「平台雙邊網路效應」,它是指平台一端的供給方越多,越能吸引到更多的需求方,進而刺激更多的供給方,雙方一起正向反饋實作平台交易量的持續提升,直到觸達增長的天花板。
而算力、模型、套用之間也有類似互相促進的聯系,更強的算力有望帶來能力更強的模型,進而支撐體驗更好的套用;而更廣泛的套用可以反哺模型的訓練,攤薄算力的成本。
目前,產業依舊在持續叠代之中。
或許會有朋友感到疑惑,從ChatGPT上線至今已有一年半的時間,這個過程雖然很熱鬧,有「百模大戰」、Microsoft Copilot、Sora等出圈的事件和產品,但並沒有看到超越ChatGPT的超級套用出現,模型表現差強人意。如果不能實作更廣泛套用,那麽長期價值該如何看待?
對於這個問題,或許上一輪深度學習的浪潮,可以給我們一個參考。
2006年,傑佛瑞·辛頓提出了「深度神經網路」的概念。2012年,第一個套用深度神經網路的AlexNet在ImageNet影像辨識競賽中奪冠。2016年,AlphaGo在圍棋比賽中戰勝了世界頂級圍棋選手李世石。
在這些火爆出圈的事件之外,我們看到人臉辨識成為手機功能的標配,提供了一種更便捷的解鎖方式;
刷臉出入閘機成為更多寫字樓、車站門禁的選擇,帶來了更好的使用者體驗;
駕駛過程中透過語音喚醒智慧助手實作音樂播放、電話接聽等操作,既安全又便捷;
疲勞駕駛監測系統透過網路攝影機捕捉司機的面部特征,及時對疲勞駕駛行為進行提醒和預警,帶來更安全更規範的駕駛行為等等。
凡此種種,不一而足,都已經成為我們日常生活的一部份,改變了我們的生活方式。
猶記得2016年AlphaGo的出圈,帶來了社會上的廣泛關註,也是很多人開始關註AI的開始。還有亞馬遜的Echo音箱,讓一部份人意識到,原來觸屏並不是人類與終端互動的最佳方式,自出生就會的語言交流才是。
盡管受限於技術的瓶頸,智慧音箱在很多家庭被束之高閣,但仍然成為很多小朋友喜愛的玩具,每年仍有近億台的出貨量。轉譯機開始成為很多消費者出國遊玩的標配,語言不再是交流的障礙。
02
歷史總是在猶疑中前進。大語言模型也類似,在超級助理實作之前,它可能是設計師創意的靈感來源,在創作工作之前提供更多視角的創作方案;
可能是文件工作者的有利工具,快速處理和填充標準化的制式文件;
可能是人工客服的有效補充,可以二十四小時解答消費者的基礎性問題;
甚至可能是個人私教,透過與它的對話,提升某一類語言的能力,OpenAI最新釋出的GPT-4模型,聯合可汗學院已經展示了類似的案例。而更多的套用場景,全球的開發者還在持續探索,已經超出了筆者有限想象力可展望的範圍。
而蘋果的入場,給未來帶來更多的可能。作為完全掌控自身軟硬體生態的廠商,大模型的加持下,此前個人使用者很少開啟的Siri,是否隨著使用者體驗的提升,成為終端個人助理的雛形,後續的進展無疑值得期待。
或許未來有一天,每個人都擁有一個個人化的AI教師,透過與它的互動和對話,進行新的行業知識和語言的學習,在當下輔助問題解答的基礎上更進一步:
消費者不再需要開啟一個個APP去滿足不同領域的需求,只需要將需求送出給AI智慧助手,就會得到一個綜合最優的解決方案;
服務機器人走進人類的生活,能夠負責大部份的家務勞動,甚至老人的陪伴和嬰兒的照看;
自動駕駛汽車成了標配,每個人不再需要購買自己所有的交通工具,共享出行能夠滿足幾乎所有場景下的需求。
想象一下,未來的普通人一天的生活,可能是如下場景:
你一早醒來,餐桌上已經擺好了智慧助手根據你的口味和營養需求精心準備的早餐。出門前,它提醒你今天的天氣,為你挑選合適的服裝。上班的路上,自動駕駛的汽車已經靜靜等待,車內的AI系統為你播放最喜歡的音樂,同時處理你的工作信件。工作時,AI助手幫你分析數據,預測市場趨勢,甚至提出創新的解決方案。晚上回家,智慧家庭系統已經調節好室內的溫度和燈光,為你營造一個舒適的環境。
這不是科幻小說的情節,而是可展望的,人工智慧有望逐步實作的未來。
更智慧或許是人類永恒的追求,背後是人類對更美好生活的向往,對自然規律的持續探索,以及對改變世界的勇氣激發。
永遠不變的是變化本身,這正是科技發展的魅力所在。技術的進步,帶來生產力的提高,最終將令更廣泛的大眾受益。正如互聯網的出現,大幅降低了普通使用者獲取資訊的成本,打破了資訊獲取在時間、空間和數量方面的限制,也減少了傳統資訊傳播工具限制下的資訊不對稱,帶來一定意義上資訊的平權。
而AI的出現,有望帶來更高效的工具供給,讓使用者從更多基礎工作當中解放出來,提高效率,從而有更多的時間和精力去做更有意義的事情。
當然,我們也不能盲目樂觀,科技的發展從來不是線性可預測的,其過程既充滿了驚喜,也充滿了意外,這也是科技探索最大的魅力所在。
毋庸置疑,大語言模型帶來了語意理解準確度的大幅提升,進而帶來更多領域商業化套用的潛力。但模型本身的幻覺依舊存在,從而構成對更廣泛更有價值套用的制約。
數據版權、個人私密保護、模型對齊、生成內容的真實性等等,都將是長期面臨的挑戰。而工具永遠是中立的,對於借助新工具的犯罪行為的有效打擊和監管,更是全社會面臨的長期課題。
另外,具體到投資而言,我們也要對夢想與現實,故事與估值的分野有清醒的認知。
(本文作者重陽投資,秦朔朋友圈撰稿人)
本文僅代表作者觀點。