今年再不懂這個詞，你就落伍了

2024-02-17科技

2023年，AI大模型無疑是國內外科技領域最受關註的話題之一。ChatGPT大火，人們似乎看到通用人工智能的曙光。科技巨頭、創業者乃至各個行業紛紛推出自研大模型。據北京市科委等統計，截至2023年10月，國內大模型廠商及高校院所共計254家，上演「百模大戰」。

大模型熱潮中，小冰公司CEO李笛是一個特別的存在。小冰公司的前身是微軟（亞洲）互聯網工程院人工智能小冰團隊，公司曾釋出過AI聊天機器人「小冰」。因此，當ChatGPT爆火時，小冰很容易被當作對比的物件。去年，在接受【中國新聞周刊】在內的媒體采訪時，李笛都提到，他承認大模型的進步，但並非大模型的「門徒」。他認為模型不用一味求大，更願意談技術如何商業化套用。

AI少女小冰。受訪者供圖

當時，李笛被看作是個「異類」。用他的話講，大模型最熱的時候，行業裏不用「信仰」這個詞就落伍了。到了2024年，經歷了卷百億甚至千億參數的軍備競賽後，國內大模型廠商逐漸務實，落地套用成為2024年行業關註的焦點。

日前，【中國新聞周刊】專訪小冰公司CEO李笛，他談起過去一年對大模型熱的感悟。現在的他語氣輕松，李笛坦言，2023年，他曾面臨極大壓力，甚至曾動搖不卷大模型的想法。

創新和保守天然對立，科技行業的人非常害怕被認為是保守的。但另一面，李笛從2013年加入小冰團隊，見證了人工智能領域發展的幾次浪潮，很多公司在風口中迷失。和李笛的專訪，並不只是在探討大模型，而是一個人面對巨大誘惑和時代焦慮時，如何堅持自己，做一個長期主義者。

小冰CEO李笛受訪者供圖

以下是李笛的自述。

「你不用‘信仰’這個詞就落伍了」

我們是國內較早接觸GPT大模型的一批人。2020年，小冰從微軟獨立出來前，我是微軟Bing搜尋引擎亞洲區總經理，微軟將ChatGPT放在搜尋引擎中，推出New Bing，我們都較早地看過了。當我們的興奮勁已經過去時，國內才開始興奮。

因此，我們也更早意識到，大模型有一些問題。比如，目前從技術上判斷，要實作人工智能能力更大程度的飛躍，需要在GPT-4的基礎上，把參數規模再提升三個數量級，但人們在短期內無法解決算力的挑戰。此外，一味追求參數規模越來越大，並不會有新能力湧現。最近，行業裏也有一些公司開始推出小模型。去年2月，我還判斷過，如何商業落地是大模型的核心問題。過了近一年，業內越來越多開始討論大模型該如何套用。

去年，我觀察到，國內很多企業開始圍繞大模型進行軍備競賽，背後主要有三種考量。第一種是，GPT-4推出後，大模型沒有新能力的湧現，像是卡在了紅綠燈路口，但很多人還要沖刺，因為他們想賭當自己沖到紅綠燈路口時，紅燈變綠，自己取得突破，領先行業。這一判斷確實存在一定概率，但大部份情況下，技術創新叠代並非一飛沖天，而是發展一波後被卡住，一段時間後再迎來一波創新。這才是科技史的常態。

其次，國內現在有200多家大模型公司，其中很多並非傳統意義的人工智能公司，而是各個垂直領域的企業，比如能源企業等。他們相信在掌握大模型技術後，能有機會打破該領域原有的競爭格局。這是因為大模型的基本特征是大力出奇跡，準入門檻低，可以很快看到一個結果，給了不同行業的人一個幻想。但深入後人們會發現，結果不如想象中那麽美好。

最後一種是，他們只是把大模型當作一個概念，來獲得一個新的賣點，就像是當年的元宇宙。

我們觀察到了這些現象，所以，我不願意說「信仰大模型」，大模型只是我們眾多技術叠代的一部份。去年年初，你說大模型的技術好，還是比較客觀的，但後來逐漸演變成，如果你不用「信仰」這個詞就落伍了。我記得當時參加行業會議，在我前後演講的人講到大模型，都會提到「工業革命」。當一個行業只有用這麽誇張的表達才能證明不保守時，就一定是個非常大的泡沫。我不想神化大模型，它是個有用的工具，解決了很多過去的問題，但它不是靈丹妙藥。

我現在說的時候放松多了，因為行業現在開始有了這樣的共識。在人工智能領域，一直沒有產生真正成功的面向企業和消費者的產品。2020年前，小冰還在微軟時，不太受外界影響。但2020年，小冰從微軟分拆為獨立公司營運，作為創業公司，我們還沒有能力決定自己的生存時，如果跟行業主流有很大不同，會有很多人不認同你。去年2月，就有投資人問我，你是不是反對大模型？有投資人甚至跟我說，小冰也要做超大規模的、超大參數的大模型，我也差點沒扛住。

外界對我們的誤解是，我們不做大模型。我們很早就在關註，而且一直深入其中。但我們不拼大參數，更關註的是中等參數規模和小參數規模大模型的可用性。很早Google就發過論文稱，650億參數以下的模型，沒有產生明顯的思維鏈能力。我們當時不這麽認為，現在回頭看，我們賭對了，參數在幾百億，甚至幾十億的大模型，也有這個能力。

今年1月，我們剛剛宣布獲得「小冰大模型」的國內備案，並釋出Rinna大模型等多款產品。早在去年，我們的日本團隊推出Rinna大模型。小冰大模型最大尺寸是 14B，即140億參數，最小的是3.6B的模型。3.6B的模型在國外專業榜單中下載量和質素評分都高於參數650億的Meta大模型，就是因為我們在預訓練數據上下了功夫。

2023年7月6日，上海，世界人工智能大會(WAIC)開幕，展覽上一款會泡咖啡的服務機器人吸引觀眾眼球。來源：視覺中國

「被看作‘AI舊世代’，也是一種榮幸」

和其他行業相比，科技行業有一個突出現象：科技行業的人非常害怕被認為是保守的。在公開場合，當我們對一個新技術、特別是像大模型這麽亮眼的新技術發表評論時，哪怕只是客觀評價說「大模型是好的，但它不是全部，它沒有把過去很多東西顛覆掉」，就已經算是保守了。

我們在2013年組建小冰團隊，十年中，我們送走一波又一波風口追逐者，比如之前做智能語音助手、智能音箱等各種人工智能產品的創業者。從玩家角度，這一次國內大模型的熱潮，活躍的多是近兩年成立人工智能企業，因為很多公司都在過去一波波風口中迷失了。面對這種短期的熱潮，我們看似保守，但我們是目前為止存活越長的人工智能企業之一。從這一角度來看，我們被一些聲音質疑為「AI舊世代」，也是一種「榮幸」。但另一面，我們也承受了不少壓力。

我們在微軟時，還算是在象牙塔，獨立出來後才發現，在科技行業想要堅持做一件事情，是非常奢侈的。因為中國的科技公司，本質上是由一級市場、二級市場「擊鼓傳花」來完成企業的基本輸血。很多公司及其投資人會把上市定義為最主要的目標。如果公司不追風口，就不能拿到下一筆融資，上一筆融資的投資人就沒辦法獲得更高的企業估值，也就沒有辦法跟LP（有限合夥人）交代。這也是人之常情，但這使得很多創業公司的戰略不得不走樣了。

前段時間，有訊息稱，一個剛畢業的自然語言處理專業的博士生，年薪就有300萬元，這是不合理的，也會影響博士生的自我職業認知。創業公司願意給出這麽高的薪酬，並不是因為他們給公司創造了價值，而是當公司去拉投資時，用以回復投資人關註的指標，比如公司有多少博士，或者有多少從Open AI出來的人。有些博士生在創業公司待了三個月，又被另一家公司以更高的薪酬挖走。博士生肯定是開心的，但他們在創業公司間不斷流轉時，除了薪酬提升，沒有機會真正做有意義的研究。

你很難說這是投資人的問題，因為投資人要對LP負責。也很難說是LP的問題，因為他們掏錢就是為了獲得回報。這似乎是一個沒有人錯的事情，也是中國科技領域很難誕生原始創新的原因之一。

我們去年也曾面臨很大的壓力。投資界在經歷2022年巨大的失落情緒後迎來人工智能的浪潮，投資人看到了春天。去年在人工智能行業裏，固然有對大模型抱有熱情的人，他們往往是科研工作者。除此之外，更多科技公司表現出的是一種焦慮。就像應試教育下的心態，不能輸在起跑線上，盡管不知道它是什麽，但總覺得錯過一定會後悔。這種焦慮在行業內傳遞，但創新很難在焦慮中產生。

我個人也特別希望出現一個大模型，和小冰的對話方塊連線後，所有對話的問題都能解決，這是我做夢都會笑醒的事情。但這很難實作，背後還需要很多服務。這就像是一個個人電腦，不是說有一個CPU就得到了一切，還要有主機板，CPU本身也是一個超級大規模的集成電路，需要各種模組組合。

人工智能領域從來不缺很酷的東西。當年，微軟利用人臉辨識技術做了個套用叫「How Old」，上傳一張照片，就能辨識年齡，一時間風靡。前一陣，機器人跳「科目三」也很酷。但真正缺的、值得我們重視的是商業模式的探索，這意味著並不只是賺錢，而是究竟如何讓人們真正認同人工智能的價值，並為之買單。

我有一個印象深刻的體會，產品價值和技術不一定是息息相關的。比如有的機器人會跳舞，但人們玩膩了，就會把它忘掉。但你發現，很多女生從小買的布娃娃，毫無科技含量，但她們對它傾註了巨大的情感，有人甚至在長大後會花1萬塊錢去修復兒時的「夥伴」。技術在其中不一定需要扮演什麽角色。

今天，大家用大模型進行很多輪對話。很多人都認為，大模型要更智能、更聰明，像愛因斯坦一樣。但生活中，我們不總是因為一個人足夠聰明，才會和對方交朋友。有的人可能笨笨的，但很善良，你就不把對方當朋友嗎？人不是這樣的。那為什麽我們在做科技產品時，就一定認為更先進的技術會更好？不一定，關鍵是如何把它用在更合適的地方。

前段時間，我在朋友圈看到，因為微軟上線了免費的大模型 Copilot移動版，很多人就說終於可以退訂ChatGPT Plus了，不用支付每個月20美元的會員費。這其中還有一個很有錢的人，他都認為20美元太貴。但你要想，有的學生在遊戲裏買「皮膚」都會花好幾百元。人不總是按照理性來衡量一些事情的。

2024年，我預測人工智能行業發展會退熱，現在的大模型同質化嚴重，大家參數規模差不多，市面上用不了這麽多大模型。而且使用者的付費意願又不是很容易建立。一些去年融到錢的企業也可能會引發新的內卷，其實這些內卷的行為已經在發生了，只是在 2024 年可能會更明顯一些。

記者：楊智傑（[email protected]）