「百模大戰」，上海如何謀求勝算？

2024-02-11科技

「電腦能思考嗎？」70多年前，英國數學家圖靈提出這個問題後，人類就開始了對人工智能的探索。

隨著科技飛躍式發展，ChatGPT橫空出世不久，去年，生成式人工智能領域迎來了「百模大戰」。

相較於AI1.0時代的判別式人工智能，AI2.0時代的生成式人工智能能力更強、套用更廣。從文本對話到吟詩作畫，人工智能大模型展示著它們的十八般武藝。在上海，目前已有24款大模型完成備案、可上線提供服務，數量位居全國前列。

「上午好，我是您的財富助手海小慧。」這家銀行的手機客戶端裏，兩名數碼員工24小時線上，他們需要準確理解使用者意圖，並給出專業解答。「具體到數碼員工的‘智慧大腦’，我們借助大模型的語言理解能力和多模態套用能力，完成了2000條問題數據和10萬多條語料的知識庫訓練，」上海銀行網絡金融部資深副主管周東華介紹。

作為這一套用場景的大模型底座，這家企業自研的語言大模型，透過千億級參數等數據訓練，能充當編程、健康咨詢等各類「助手」；還能幫助行業使用者進行自訂模型開發訓練。「今天去給它看一篇非常復雜的文章，人工智能可以非常短的時間內，幫你自動給文章做摘要和總結。傳統上，我們認為都屬於人類的思考推理判斷範疇內的能力，今天，我們看到大模型已經越來越多地具備並且呈現出來，」商湯科技聯合創始人、上海公司總經理楊帆告訴記者。

算力、演算法和數據，是訓練人工智能大模型的三個關鍵要素。

在位於上海徐匯的大模型創新生態社區「模速空間」，掛牌4個多月來，已經迅速集結起約50家大模型相關企業。在這裏，「上下樓就是上下遊」，靈感的火花在此碰撞、迸發。

在這家企業研發的通用視覺多模態大模型裏，輸入「90年代、上海黃河路、王家衛電影風格」等關鍵詞，很快，人工智能生成的圖片和短影片，就躍然眼前。「我們的模型基於1張圖片，去推測後面圖片的運動軌跡，把它拼成一起，就是一個4秒的短影片，」智象未來公司品牌負責人張一鳴介紹。目前，研發團隊正在加速提升這一大模型能階；而算力緊缺，是當下企業成長過程中遇到的「小煩惱」。

看到下遊企業的需求，同在「模速空間」的這家上遊企業，自研了軟硬件協同智算一體機等設施，能為大模型的研發和算力高效利用提供重要支撐。「能夠把GPU（圖形處理器）的使用效率提升2到4倍；就是說，我做同樣的一個任務，原本需要2秒，現在只需要1秒到半秒，」無問芯穹公司行政總裁夏立雪說。

與此同時，「模速空間」裏的五大公共服務平台，也能提供算力排程、大模型備案等支持。

上海大模型生態發展有限公司總經理陳海慈表示：「對標科創中心建設，整個‘模速空間’建設，跟過去做產業園區最大的區別來說，是我們不是以空間載體撐滿為目標，而是以創新、創業，或者創新策源的濃度跟動能為評價標準。」

聚焦大模型創新能力、創新要素供給等方面，去年底，上海已正式釋出11條舉措，為大模型創新發展指明方向。

「我們要通向通用人工智能，還需要在基礎研發方面繼續往前走；同時，逐漸探索向各個行業落地的可能性，把大模型從閑聊的工具，逐漸變成能夠跟場景的需要相結合、深入落地、提供價值的這麽一個‘利器’，」上海人工智能實驗室領軍科學家林達華說。