如何把商業交給大模型？京東科技何曉冬：需要更嚴肅地把大模型「幻覺率」降下來

2024-08-01科技

從談參數、談技術，再到談協同、談套用，百模大戰初始的狂熱開始變得冷靜，今年，大模型公司們明顯變得更加務實、實際，市場也逐漸回歸理性。

7月30日，京東雲對外釋出了一系列產品，包括企業大模型服務、言犀智慧體平台、智慧編程助手JoyCoder、言犀數位人3.0等。【每日經濟新聞】記者從京東雲方面了解到，目前在京東內部，有100多個AI場景，以及35萬自有配送員、23萬商家和2萬采銷都被大模型的套用覆蓋。

無論是否擁有產業一側的基因，大模型都開始在不同場景更實際地落地，大模型公司們也從參數和技術的比拼，來到了商業生態之上，端到端產品的較量。比如，今年以來一些雲廠商開始聚焦AI PC的落地，談起具身智慧的前景等。

不過，在產業套用之前，大模型依然有很多待解的難題。京東探索研究院院長、京東科技人工智慧業務負責人何曉冬認為，想在更多產業側套用落地，其一就是需要更嚴肅地把大模型的「幻覺率」降下來。

也就是說，在答錯「13.8和13.11哪個數位大」，生成視訊畫面變形扭曲嚴重之時，你都還無法將自己的商業交給大模型。

談數位人直播： 正在超越80%真人主播

清華系大模型公司生數科技，今日（7月30日）在全球範圍上線視訊生成模型Vidu，全面開放文生、圖生視訊能力。Sora之後，從快手可靈到如今的Vidu，國內視訊生成大模型驚喜不斷。

不過，何曉冬指出，目前視訊生成大模型產品的幻覺率普遍還是很高。他舉例Sora的「漫步在東京街頭的女子」這則視訊，雖然整體視訊效果栩栩如生，但仔細觀察會發現，視訊中人物在行動時，左右腳交替時有扭曲的痕跡。

「這當然是瑕不掩瑜，也不能說這個技術不驚艷，但想把這種技術套用到商用場景下會出現很多問題。」何曉冬如此解釋。

這一點體悟來自於4月數位人劉強東直播帶貨的時候。當時劉強東數位人連續直播了4場，場觀都在千萬級以上，但同時引發的關註和爭議都很多。比如，采銷東哥數位人是否「一眼假」？形態、動作和口音的擬真程度有多高？當然，也有數位人馬雲何時出現的有趣討論。

在當下直播電商爆火的時代，主播其實是「稀缺品」，特別是跑出來的大主播，其實對其氣質形象、直播內容和產品服務的介紹專業度等都有著很高很復雜的要求。

「在過往的產業實踐中，透過一些有效的效果轉化指標，我們能看到數位人直播已經可以達到真人主播的均值。」何曉冬認為，數位人直播除了需要具備零幻覺之外，還要有零樣本、大姿態和超寫實等幾個特性，做到真實、高效和可控。

不過他也指出，數位人直播要做的不是替代20%的優質主播，而是希望透過更個人化的角色和豐富的玩法，覆蓋80%需求還沒有被滿足的品牌。

今年「618」，數位人劉強東爆火後，董明珠等也在京東雲客製了數位人形象並上播。除直播外，數位人還活躍在文旅導覽、智慧導購、金融客服、個人助理、政務咨詢等業態中。

談具身智慧：重點聚焦服務型機器人

前幾天，香港投資管理有限公司正式宣布投資具身機器人公司「銀河通用」，投資金額未披露。其實不久前，銀河通用才剛宣布完成天使輪融資，總規模7億元人民幣，投方包括藍馳創投、北汽產投、美團戰投、商湯國香基金、啟明創投、經緯創投、源碼資本等一眾明星機構。

具身智慧是一個涉及人工智慧、機器人學和認知科學的跨學科概念。它主要研究如何使機器或系統能夠透過身體（物理形態）與環境進行互動，從而實作智慧行為。簡單來說，其中的一種套用就是，系統透過執行器（如機械臂、輪子等）對環境進行物理操作，實作移動、抓取物體等行為。

這自然也成了大模型及其相關技術產品一次更前沿的外延性套用和嘗試。銀河通用聯合創始人姚騰洲透露，銀河通用首款具身多模態大模型機器人Galbot率先套用在零售業完成上貨、取貨及盤點等工作任務，後續會探索社群養老、家庭服務等場景。

何曉冬在談及具身智慧時認為，具身智慧是數位人走向物理世界的載體。而智慧體、數位人、具身智慧又是未來大模型與終端使用者的核心互動介質。記者註意到，京東探索研究院不久前釋出了國內第一個雙臂移動機器人運算元據集JD ManiData。

在談及最新研究時，何曉冬透露，在基礎模型上，團隊正研發多模態具身智慧的基礎模型，讓機器人的執行效率更高，動作更流暢。重點則是聚焦在服務型機器人產品上。

「在端側上我們也基於模仿學習，叠代端側多技能操作能力，在指令驅動下可以完成不同操作任務，為的是可以做到更高價值的套用。」

伴隨大模型而來的AI、機器人浪潮不斷席卷資本市場。

這也不難讓人聯想到，繼去年12月數千萬元A輪投資後，前幾日，京東2億元再度戰略投資AI炒菜機器人公司橡鹿科技，目的是探索「機器人+」產業，在端側做更多AI、大模型技術的嘗試。

談Scaling Law和價格戰： 只提升模型規模，天花板並不遠

今年5月，OpenAI推出了GPT-4o，並宣布了免費試用政策，API呼叫的價格也比GPT-4-Turbo少了一半。大模型市場價格戰正式打響。7月18日，OpenAI推出最具成本效益的小模型GPT-4o mini。據OpenAI介紹，小模型產品是想透過顯著降低AI使用成本，擴大AI使用範圍。包括Meta、谷歌等科技巨頭也紛紛推出最新產品，並在價格上無一例外地開卷。

國內大模型價格戰也被點燃。5月6日，大模型公司DeepSeek深度求索宣布將輸入價格降至1元/百萬tokens。隨後，字節跳動的豆包大模型、阿裏巴巴的通義系列模型以及百度的文心一言模型等紛紛跟進，均采取了降價策略。

何曉冬認為，價格戰在短期內的確可以帶來繁榮，但長期來看並不見得是件好事。「很可能連電費都付不起。」他坦言。

最直接的影響在於，短期內，價格戰有助於大模型在B端、C端等市場層面的普及。但犧牲短期利益，是否可以實作長期的使用者價值，實作規模化的套用，最終推動技術成為基礎設施，這還需要打個問號。

何曉冬說：「我們看到一方面大模型技術在飛速發展，但目前也面臨一些問題，首先就是Scaling Law（規模定律）。由於數據和算力的持續限制，如果簡單只是提升模型規模，看起來這個天花板其實並不遠。某種意義上，我們的大模型從百億到千億再到萬億（參數）的增長，問題還是出現在其所帶來的經濟效益在何處。」

因此，他判斷，如果大模型帶來經濟效益不足以支撐大模型本身的成本的話，那麽這個模式是難以持續的。他還坦言，大模型的商業化落地，現在目前看起來還是稍微有些落後，從中長期看起來，會成為一個問題。他覺得，產業和技術應該是互為驅動的。

｜每日經濟新聞 nbdnews 原創文章｜

未經授權禁止轉載、摘編、復制及映像等使用

每日經濟新聞

如需轉載請與【每日經濟新聞】報社聯系。