本次對話的雙方是微軟 AI 的行政總裁 Mustafa Suleyman 和企業家 Reid Hoffman 。對話圍繞人工智能(AI)的未來發展展開,深入探討了其潛在影響力、技術挑戰及創新成果。自成立以來,微軟 AI 一直致力於推動人工智能技術的進步,透過創新的產品和服務顯著提升使用者體驗和工作效率。目前,微軟在 AI 領域不僅重視消費級套用,還積極參與技術基礎設施的構建。
Mustafa Suleyman 和 Reid Hoffman 的核心觀點包括:
智能代理與個人化特征的關系 :未來的智能代理將與個人化特征密切相關,強調情感智能(EQ)與智商(IQ)的結合,以更好地滿足使用者需求。
技術的創新潛力與風險 :AI 的創新潛力巨大,能夠幫助人們更好地溝通和理解復雜問題。然而,完全自主性和自我改進的能力也帶來了潛在風險,需引起重視。
智能代理的理解能力 :未來的智能代理將具備更強的理解能力,能夠即時觀察和執行任務,從而提升使用者的生活效率和創造力。
小型化模型的發展趨勢 :小型化模型將成為未來的發展方向,透過蒸餾技術實作高效學習,適應特定套用場景,降低使用門檻。
以下是本期播客內容的完整轉譯,我們作了不改變原意的刪減。
未來的智能代理與個人化特征密切相關
列特·霍夫曼(Reid Hoffman)
有時候,人們常常把 AI 比作一種生物體。想象一下,這就像是……(笑),從小規模開始發展,就如同我之前提到的那樣。
列特·霍夫曼(Reid Hoffman)
將其視為理解人工智能的一種視角如何?在哪些方面它是有益的?在哪些方面可能會產生誤導?這種視角應如何引導全球範圍內的討論和該方向發展的行程?
穆斯塔法·蘇萊曼(Mustafa Suleyman)
我認為,當我們遇到某種全新事物時,就像面對從未見過的東西一樣。每一次新的技術浪潮都會帶給人們這樣的感覺。設想一下,當電力第一次出現的時候,那該是多麽神奇和瘋狂;又或是透過電話路線與遠在大西洋彼岸的人交談,這該是多麽令人震撼。這為我們的世界觀帶來了一種全新的可能性思維方式。
每當出現這種情況時,我們都會努力尋找合適的比喻,將其與已知事物聯系起來。盡管最終它可能與我們已知的事物並不完全相同,但在它到來之前,這是我們能想到的最佳比喻。 因此,我提出數碼新物種的比喻。 因為從整體上看它們的能力,這確實是最貼切的類比。雖然這也引發了一些關於我們不希望其成為那樣的擔憂,但我認為這恰當地框定了如何控制它們的問題。
這些模型將能夠看到你所看到的,聽到你所聽到的,即時理解並與文本互動,並代表你采取行動。這些能力現在開始變得流行。我認為,將其比作物種是最合適的,這個比喻在思考我們不希望它成為的樣子時也提供了有益的視角。
列特·霍夫曼(Reid Hoffman)
關於物種,我們必須做些什麽,以及哪些是我們應盡量避免的,以更好地引導我們進入數碼時代?順便提一下,我推薦穆斯塔法的書【The Coming Wave】,這本書對此進行了深入探討。
穆斯塔法·蘇萊曼(Mustafa Suleyman)
我認為,這些模型的一個令人驚嘆之處在於,它們並不會簡單地輸出你輸入的內容。這正是軟件的偉大目標之一,不是嗎?我們期待它能告訴我們一些我們尚未知曉的事物。因此,我覺得用「幻覺」來描述似乎不太準確。我認為,這並不是缺點,而恰恰是一種優點,體現了創造性和互動性。
在創造性方面,我們期待在給定輸入的情況下產生各種可能的反應,這種靈活性和模糊性正是我們所需。因此,讓它們自主學習特征表示,而不是依賴我們手動設計特征,這正是過去 15 年機器學習的核心動機。如今模型能做到這一點,實在令人欣慰。
但我們需要弄清楚這種學習的界限在哪裏。目前,還幾乎沒有出現遞迴式的自我改進。也就是說,不存在一個迴圈的自我改進過程,在沒有人類直接監督的情況下進行。但是我們預計,到 2025 年,各團隊將開始在這方面進行實驗,因此,我認為這需要特別關註。
另一個問題是完全自主性。顯然,如果這些模型能夠在任意數碼環境中互動,自動建立虛擬機器、執行網頁操作、呼叫 API,並在沒有人類監督和控制的情況下自主執行,會帶來額外的風險。這兩種能力是我們該特別關註和擔憂的。
列特·霍夫曼(Reid Hoffman)
從積極的角度出發來看。
穆斯塔法·蘇萊曼(Mustafa Suleyman)
我認為,這些技術的積極一面在於其極大的創新潛力。我相信,它們可以幫助我們與更優秀的自我溝通。實際上,如果設計得當,它們不必表現得諷刺、批評或羞辱。雖然大多數人可能不喜歡譏諷的態度,但沒必要讓這些技術變得刻薄。有些開發者可能會設計出具有這些特性的 AI 伴侶,但這完全取決於設計者,而非必然結果。
我們應盡最大努力在生態系、規範和價值觀等方面限制這類現象。當然,仍然會有人這樣做。然而,我認為這些技術仍有巨大的潛力幫助我們展現最好的一面。比如,我在三周前讀到一篇關於某個真實小群體對陰謀論(例如「地平論」)的研究論文。
列特·霍夫曼(Reid Hoffman)
有多少這樣的例子?
穆斯塔法·蘇萊曼(Mustafa Suleyman)
的確,我想在可能的情況下還是避開有關選舉的話題。不過,比如說,我認為我們都應該同意,「地平論」是一個非常荒謬的理論。有些人在與聊天機器人進行長時間的交流後,大約六周後,他們對陰謀論的信任度有所降低。這是因為聊天機器人有耐心且沒有偏見。它不會貶低你,而是始終努力回到核心話題,通常參照有證據支持的科學文獻。因此,我認為這能帶來非常積極的效果,這樣的結果讓人非常驚喜。
列特·霍夫曼(Reid Hoffman)
我本打算稍後問這個問題,但我覺得現在問時機正好。我們在創辦 Inflection 時,其中一個創辦原則就是認為情商(EQ)和智商(IQ)同樣重要。
穆斯塔法·蘇萊曼(Mustafa Suleyman)
好的。
列特·霍夫曼(Reid Hoffman)
請簡要談談這對 Pi (Inflection 旗下的人工智能聊天機器人)意味著什麽,背後有哪些思考,以及為什麽這在各個領域都很重要,不僅僅影響 Pi 本身。
穆斯塔法·蘇萊曼(Mustafa Suleyman)
是的,我想說,我們通常可以認為 IQ(智商)包括答案的準確性、速度、全面性、相關性以及即時資訊獲取能力。在這些方面,我們都在穩步進步。我註意到,AI 研究者社區的人往往忽視了資訊傳遞方式的重要性。他們常常以一種非常學究的方式,只是陳述事實,認為人們會明顯看到這是正確的。
列特·霍夫曼(Reid Hoffman)
確實,這是工程思維。
穆斯塔法·蘇萊曼(Mustafa Suleyman)
事實證明,這些模型在語氣、風格和情感智能方面的表現(例如提問的方式和反映你可能使用的語言風格)在資訊傳遞中對消費者而言,可能比單純客觀地復述維基百科上的內容更為重要。因此,我認為這是一個關鍵能力,現在每個人都在努力解決這個問題。 未來的智能代理不僅關註顯而易見的行為,更與個人化特征密切相關。 我對個人化技術的實作非常感興趣,因為我認為這將成為人們真正重視的東西。
列特·霍夫曼(Reid Hoffman)
那麽,我們來談談未來代理的發展。請您為我們提供一些見解,比如從協作助手的角度來看,代理將如何發展?您對此有何看法?在未來兩到五年內,代理會在我們的生活中扮演什麽角色?從整體物種到具體代理,哪些是最重要的方面?我們應該如何與代理共存呢?
穆斯塔法·蘇萊曼(Mustafa Suleyman)
邁向智能未來的第一步是讓你的 AI 夥伴能夠看到你所見到的東西。 一個真正能辨識你螢幕、瀏覽器、桌面和手機內容的助手,意味著它能夠持續接收視覺輸入。這讓你的 AI 夥伴可以觀察到你所見的事物,你能夠使用模糊的表達,如「記得我看到的那個東西嗎」或者「那些東西在哪裏」。這是前所未有的理解能力。這種理解力使得你的 AI 能以你的名義執行任務,如瀏覽網頁、使用 API、預訂、購買和規劃。
目前,我們已經看到許多類似功能的精彩演示,表明這些技術在實際套用場景中還需要進一步完善。正如在 GPT-3 出現之前,許多大公司內部已經擁有的大語言模型在 2020 年、2021 年時尚未成熟。
讓技術在 50%到 60%的時間裏有效是一個良好的開端,但我們必須將其效能提升至 99%的準確率。語音辨識和聽寫技術經過了 15 到 20 年的發展,直到過去兩到四年才達到約 99.5%的準確率,個人化同樣如此。因此,越來越多人使用語音技術,這不僅僅因為它的輸入能力,還因為它的生成能力。我認為,實作這一目標可能還需要幾年時間。
列特·霍夫曼(Reid Hoffman)
語音輸入技術的進步讓我深感認同,其中一個原因是生成式 AI 的革命使其更擅長參與對話,如我們多次討論的那樣。現在,你只需直接說出內容,生成式 AI 就能準確解讀。那麽,這將如何進一步提升代理的水平呢?
穆斯塔法·蘇萊曼(Mustafa Suleyman)
是的,使用者介面的設計或輸入框的限制抽象地決定了我們可以在其中輸入什麽。由於搜尋引擎的搜尋框只有一個小視窗,我們學會了搜尋的語言,對吧?將想法壓縮成三到五個詞,這甚至算不上一個完整的句子。
列特·霍夫曼(Reid Hoffman)
這個數碼的平均值為 1.6,僅供參考。
穆斯塔法·蘇萊曼(Mustafa Suleyman)
這些語音體驗的有趣之處在於,當你與電腦互動時,它能激發你思維中的新角度。你可以用完整的句子進行交流,自行糾正,調整語句順序,並融入即興對話中的各種「雜質」。當模型以段落形式回應你時,你可能突然想到討論一些從未數碼化的主題。因此,我認為這提供了一個很好的框架,預示未來行為可能會發生的變化。
有一個幾乎能處理任何數碼任務的 AI 夥伴,你會讓它幫助你完成一些現在不願或無法在電腦上完成的任務。我認為這是一個重大的轉變,因為實作目標的門檻將大幅降低。不僅因為邊際成本為零,而且摩擦幾乎消失。因此,你會想到一些過去因難度過大而未曾考慮的事情。
列特·霍夫曼(Reid Hoffman)
這種技術如何幫助我們提升創造力呢?與這些智能體互動可能激發哪些類別的創造力和靈感?
穆斯塔法·蘇萊曼(Mustafa Suleyman)
想象一下,在一整天中,你腦海中會浮現出多少隨機的想法、念頭或問題。當你深入冥想你的潛意識時,會覺得許多瞬間的思緒,比如「我想知道」或「我覺得」,幾乎是不經過語言組織的。由於沒有人總是願意傾聽你分享各種想法,這些念頭通常不會被說出口。你也未必總有精力去打字,因為用手機打字需要相當多的精力。我每天大約搜尋五到八次,算是盡力了。因此,如果獲取和整理這些想法的難度下降,你的創造性思維廣度就會增加,這些思維將在你的 AI 助手的背景中顯現。
此外,AI 的記憶能力將比其他能力更早實作。 我非常有信心,到 2025 年,永久記憶將成為現實。 現在我們已經可以在網上儲存記憶,並且非常準確地檢索資訊。Copilot 能夠提供很好的參照,它能即時更新到 15 分鐘前,掌握最新的新聞和網絡動態。我們只需將這些資訊整合到你的個人知識圖譜中,然後將其套用到文件、電子郵件和行事曆等工具中。
記憶能力將徹底改變這些體驗,使你不再在有意義的對話或有趣的創意探索後,完全忘記曾經討論的內容。因此,這也是一個重大的轉變,因為它不僅降低了你表達創意的門檻,還防止了想法的遺忘。你可以模糊交叉地參照幾周前提到的某件事情。
列特·霍夫曼(Reid Hoffman)
這和我們剛才討論的事情有關嗎?這更像是一場對話。
穆斯塔法·蘇萊曼(Mustafa Suleyman)
這就像是一種對話。確實如此,這就像你有了第二個大腦,成為你想法的延伸。因此,情商(EQ)在這方面顯得尤為重要。這完全正確。
小型化模型是未來的發展方向
列特·霍夫曼(Reid Hoffman)
現在讓我們深入討論業務戰略層面的問題。很多企業家都會考慮如何預估該領域未來幾年的發展。那麽,有哪些需要註意的事項呢?
穆斯塔法·蘇萊曼(Mustafa Suleyman)
好訊息是,模型正在變得既大又小,這一趨勢幾乎肯定會持續。去年開始流行一種稱為「蒸餾」的新方法。透過蒸餾,大型且智能、推理成本高的模型可以指導小模型,而小模型則能夠透過 AI 的反饋進行強化學習。目前有強有力的證據表明,這種監督效果顯著。
不過,規模仍然是重要因素。 我們還有很大的發展潛力,並會有大量數據支持這一趨勢。因此,我認為至少在未來兩到三年內,規模化模型將繼續帶來顯著的效能提升。此外,還有新的模式正在加入。我們不僅增加了影片、影像等內容,更大的挑戰在於理解我們感興趣的行為軌跡,這些軌跡跨越了復雜的數碼環境。從瀏覽器到桌面,再到手機,在不同的生態系之間轉換,無論是在封閉的環境中還是開放的網絡內。我們正在努力理解這些軌跡,收集大量數據,並進行有監督的微調等。我相信這將帶來許多令人印象深刻的成果。
列特·霍夫曼(Reid Hoffman)
另一個顯而易見的觀點是,關於數據的討論可以從多個不同的角度切入。比較常見的問題是,我們可以使用哪些數據,這些數據的質素如何。我認為,這方面的討論在網絡上已經有大量的內容。然而,有一個方面可能尚未引起足夠的關註,那就是新的數據來源。合成數據的吸重力在於,它能用於訓練更好的小模型和大模型。那麽,我們如何獲取這些數據?又該如何確保這些數據能夠成功整合?對於創業者來說,應該如何看待這些問題?
穆斯塔法·蘇萊曼(Mustafa Suleyman)
當考慮一個引導語時,不僅僅是您向聊天機器人提問的內容。語言可能會帶來困惑。問題本身並不是引導語。真正的引導語可能是一個三頁的風格指南,裏麪包括一系列要模仿的範例。接下來,您向已經經過該引導語訓練的模型提問。從這個角度來看,引導語就像是您的數據。它是高質素的指令集,為您的預訓練模型提供指導,使其按照某種方式執行。
有趣的是,即便只有幾頁指令,模型的表現也可能與那些使用其他引導語的模型大相徑庭。總而言之,為了讓模型準確表現並真正遵循您的企業品牌價值觀或獨特產品,您需要展示數萬個高質素行為的範例。這些範例必須嵌入模型中,這是基於高質素數據繼續進行的預訓練過程。
好訊息是,對於許多小眾領域或特定行業而言,數萬個範例相對容易獲得,這是一個優勢。我認為,對於初創公司而言,在對預訓練模型進行高質素微調方面有很大的機會。這樣,您可以更好地堅持您所重視的行為準則。
列特·霍夫曼(Reid Hoffman)
企業家在使用和部署小型模型時應該怎麽思考呢?顯然,他們會借助 Microsoft、OpenAI、Google 等公司提供的前沿和大型模型,這些公司擁有價值數十億美元的技術基礎。然而,小型模型所帶來的機會又該如何看待?企業家如何充分利用這些機會,創造出有趣且獨特的產品或服務呢?
穆斯塔法·蘇萊曼(Mustafa Suleyman)
是的,我的意思是, 我認為小型化絕對是未來的發展方向。 因為如果你考慮一下那些非常大的模型,當你向某個前沿模型提出問題時,它啟用了數十億個與當前查詢並不相幹的神經路徑。讓人驚訝的是,它居然能夠如此高效地執行這一過程。
我是說,它能在每次生成標記時搜尋或參考數億個節點,這實在是不可思議,但其實並不必要。如果你有一個明確的套用場景,我認為我們應該做的就是將知識濃縮到更小、更經濟的模型中,使其更易於攜帶和使用。
列特·霍夫曼(Reid Hoffman)
之前我從未聽過你使用這個比喻。
穆斯塔法·蘇萊曼(Mustafa Suleyman)
我現在想不出我能想到的最小的數碼化事物。我甚至不確定它是否算作數碼化。哦,我想起了一種——每天早晨迎接你的器材,它可以與您互動,可能是一種耳塞、可穿戴器材、耳環,或者甚至是帶有小傳感器的花盆。這似乎預示著一個無處不在的感知科技革命即將到來。
我認為這是一個充滿潛力的領域,也是技術小型化的發展方向。 即使像冰箱磁貼這樣的器材不太可能掌握太多量子計算的知識,但它可以在早晨迎接你,提供天氣預報,簡單介紹冰箱裏的食物,或提醒你的日程。我相信,這樣的器材可能只需要數千萬個參數。人們在這一領域的探索還不夠廣泛,但對一個由兩人組成的團隊來說,這完全是可以研究的。確實如此。
列特·霍夫曼(Reid Hoffman)
作為創業活動中至關重要的一環,我希望在接下來的兩天裏,大家能思考一個重要的問題。雖然這個問題有些突然,但我會給你們充足的時間來考慮。我先分享一下我的看法。作為技術人員,我們應該思考哪些因素才能設計出一個更加人性化的未來?
當我們談到「更加人性化」時,往往會聯想到人類在過去幾千年的行為和經驗。這些當然很重要,但同樣重要的是展望未來。在我們發展技術的同時,人性也在不斷前進演化。我們的工具和器材正在影響著人類身份的變化,因此,我們不應該只關註我們具備的情感、熱情和同情心。這些特質在我們與技術互動和發展的過程中展現出來。我向大家提出的關鍵問題便是設計。希望你們能利用這段時間認真思考。
穆斯塔法·蘇萊曼(Mustafa Suleyman)
問問自己,你是否全力以赴了?因為現在確實是一個轉折點。我真的認為,我們已經有足夠的證據表明,在過去五十年中,隨著技術的巨大變革,各個事物的結構已經被重新定義。
我認為,現在正是創立和擴充套件公司的最佳時機。 即使你不是企業家,而是一名活動家、組織者或學者,如今也是重新調整職業的好時機。因為到了 2050 年,形勢將會大不相同。我們現在有機會共同塑造事物的發展方向,沒有什麽是註定的。我們完全有能力將其發展為最有利於人類的狀態。我認為,我們非常幸運能夠生活在這個時代,這種感覺充滿力量,同時也伴隨著巨大的責任。
列特·霍夫曼(Reid Hoffman)
我完全同意。現在你應該明白為什麽了。我非常激動能夠與 Mustafa 合作。謝謝你。