「電腦能思考嗎?」70多年前,英國數學家圖靈提出這個問題後,人類就開始了對人工智慧的探索。
隨著科技飛躍式發展,ChatGPT橫空出世不久,去年,生成式人工智慧領域迎來了「百模大戰」。
相較於AI1.0時代的判別式人工智慧,AI2.0時代的生成式人工智慧能力更強、套用更廣。從文本對話到吟詩作畫,人工智慧大模型展示著它們的十八般武藝。在上海,目前已有24款大模型完成備案、可上線提供服務,數量位居全國前列。
「上午好,我是您的財富助手海小慧。」這家銀行的手機客戶端裏,兩名數位員工24小時線上,他們需要準確理解使用者意圖,並給出專業解答。「具體到數位員工的‘智慧大腦’,我們借助大模型的語言理解能力和多模態套用能力,完成了2000條問題數據和10萬多條語料的知識庫訓練,」上海銀行網路金融部資深副主管周東華介紹。
作為這一套用場景的大模型底座,這家企業自研的語言大模型,透過千億級參數等數據訓練,能充當編程、健康咨詢等各類「助手」;還能幫助行業使用者進行自訂模型開發訓練。「今天去給它看一篇非常復雜的文章,人工智慧可以非常短的時間內,幫你自動給文章做摘要和總結。傳統上,我們認為都屬於人類的思考推理判斷範疇內的能力,今天,我們看到大模型已經越來越多地具備並且呈現出來,」商湯科技聯合創始人、上海公司總經理楊帆告訴記者。
算力、演算法和數據,是訓練人工智慧大模型的三個關鍵要素。
在位於上海徐匯的大模型創新生態社群「模速空間」,掛牌4個多月來,已經迅速集結起約50家大模型相關企業。在這裏,「上下樓就是上下遊」,靈感的火花在此碰撞、迸發。
在這家企業研發的通用視覺多模態大模型裏,輸入「90年代、上海黃河路、王家衛電影風格」等關鍵詞,很快,人工智慧生成的圖片和短視訊,就躍然眼前。「我們的模型基於1張圖片,去推測後面圖片的運動軌跡,把它拼成一起,就是一個4秒的短視訊,」智象未來公司品牌負責人張一鳴介紹。目前,研發團隊正在加速提升這一大模型能階;而算力緊缺,是當下企業成長過程中遇到的「小煩惱」。
看到下遊企業的需求,同在「模速空間」的這家上遊企業,自研了軟硬體協同智算一體機等設施,能為大模型的研發和算力高效利用提供重要支撐。「能夠把GPU(圖形處理器)的使用效率提升2到4倍;就是說,我做同樣的一個任務,原本需要2秒,現在只需要1秒到半秒,」無問芯穹公司執行長夏立雪說。
與此同時,「模速空間」裏的五大公共服務平台,也能提供算力排程、大模型備案等支持。
上海大模型生態發展有限公司總經理陳海慈表示:「對標科創中心建設,整個‘模速空間’建設,跟過去做產業園區最大的區別來說,是我們不是以空間載體撐滿為目標,而是以創新、創業,或者創新策源的濃度跟動能為評價標準。」
聚焦大模型創新能力、創新要素供給等方面,去年底,上海已正式釋出11條舉措,為大模型創新發展指明方向。
「我們要通向通用人工智慧,還需要在基礎研發方面繼續往前走;同時,逐漸探索向各個行業落地的可能性,把大模型從閑聊的工具,逐漸變成能夠跟場景的需要相結合、深入落地、提供價值的這麽一個‘利器’,」上海人工智慧實驗室領軍科學家林達華說。