波士頓動力創始人對話國內四大AI機器人CEO：「人形機器人是炫耀而非生產力」｜鈦媒體AGI - 科技

2024-08-24科技

8月24日下午，2024世界機器人大會上，舉行了一場期待已久的中國、美國「具身智慧」與人形機器人領域學者的「世界對談」。

大名鼎鼎的「機器狗之父」、美國波士頓動力創始人Marc Raibert（馬克·雷伯特）首次來到北京。他說，「我簡直不敢相信，不僅是機器人的數量，難以置信，還有這麽多熱情的人參加了展覽。中國對機器人的興奮和熱情很高。」

而此次與Marc對談的四位CEO所在的公司也不尋常：除了宇樹科技之外，星動紀元、銀河通用、北京具身智慧機器人創新中心都成立不足2年，一出道就是具身智慧和人形機器人行業的「頂流」。

而且，星動紀元、銀河通用背後也站著中國最高學府：北大和清華，代表著中國前沿科技創新的重要來源。

其中， 星動紀元由姚期智帶領的清華大學交叉資訊研究院孵化成立的，星動紀元創始人陳建宇現在還是清華大學交叉資訊研究院助理教授，公司融資超億元，聯想創投已加入其中。

銀河通用機器人創始人的王鶴則是北京大學助理教授，也是北京智源人工智慧研究院具身智慧研究中心主任，過去半年，銀河通用完成天使輪融資共計7億元人民幣，重新整理了國內人形機器人領域單輪融資規模，美團戰投、北汽產投、商湯國香基金、訊飛基金、啟明創投、藍馳創投、經緯創投、源碼資本、IDG資本等頭部財務機構都參與其中。

而北京具身智慧機器人創新中心則是北京市發起成立的機器人「國家隊」機構。北京具身智慧機器人創新中心總經理熊友軍，目前還是「人形機器人第一股」優必選科技CTO。

Unitree Robotics（宇樹科技）也是當下人形機器人行業的明星企業。公司創始人、CEO、CTO王興興畢業於上海大學，取得了機械工程碩士，具有近10多年足式機器人研發經驗，擁有產品從0-1-100的研發與商業化落地能力，100+項機器人相關專利。

此次圓桌由德國慕尼黑工業大學教授 Alois.C.Knoll主持，美國波士頓動力創始人Marc Raibert（馬克·雷伯特），與中國四大AI機器人企業領軍者——陳建宇、王興興、王鶴、熊友軍，五人圍繞機器人行業、AI 大模型驅動機器人發展等議題展開討論。

一個多小時的圓桌當中， Marc表示，未來5年，機器人硬體發展仍將非常重要，但同時，能夠打破語意理解障礙的基礎模型或其他 AI 方法也將對機器人技術產生更大的影響。不過，要想取得機器人領域真正的進步，就需要更高的可靠性和安全性，未來人們需要投入大量資源努力解決此類問題。

Marc非常不看好人形機器人行業。他認為，工業機器人已經非常成熟，而且能夠商業化，目前人形機器人「在某種程度上是一種炫耀，而不是一種生產力」。

陳建宇表示，過去10年AI發展很快，從簡單的影像處理，到深度學習、強化學習，再到ChatGPT技術，這對於未來「具身智慧」產生很大的影響。未來幾年，AI、具身智慧會與人形機器人不斷融合，去訓練一個通用模型。他相信未來5年，我們將迎來「機器人的ChatGPT時刻」。

王鶴指出，當前 AI 大模型在機器人上仍有巨大的局限，尤其是「泛化的開瓶蓋」技能還沒有訓練出來，但同時，這也是大模型帶來了重要機會，一旦大模型湧現能力不斷加強，他認為未來5年，依然有一個至少做操作任務的通用機器人機會。

熊友軍表示，當前關節效能提升、高的能量和電池密度的提升非常快，使得機器人的運動控制能力、電機等方面提升非常快。未來5年，機器人關節和能量密度會持續提升。畢竟和人類相比，現在機器人的能量執行效率還是有非常大的差距。

以下是鈦媒體AGI編輯對此次圓桌全文整理：

問：您能否向觀眾簡單介紹一下您的工作：您為什麽以及什麽時候開始對人形機器人感興趣的？

Alois：我從 2001 年開始擔任慕尼黑大學的教授。我對人類噪音的一個方面產生了興趣，那就是具象化，對吧？我的朋友 Pfeiffer 和我們一起從大學畢業。蘇黎世退休了，不幸的是，我們堅信具象化。所以我們認為，在我們的人類型別中，智力只會在以非常自然的方式與世界相連的人類型別身體中發展。所以身體應該有同樣的動力，同樣的尺寸，等等。否則，就很難做到這一點，你在這裏看到的 Kronos 系列機器人，左邊，左下角的 Roll Boy2024 就是這種信念的結果之一。

Marc： 我認為你貼出的那張圖片對我回答這個問題很有幫助。如果人形機器人意味著兩只胳膊、兩條腿直立向前，那麽直到最近我才對此感興趣。事實上，我一直認為現在的公司註重功能性，作為一名教授，我認為功能性才是最重要的，機動性、靈巧性、感知力和智慧，而外形和外觀則是次要的。另一方面，如果人形機器人意味著像腿一樣的動態生命，我會把它與世界互動。我一直是人形機器人的粉絲，盡管我建造的第一個機器人是彈簧單高蹺的東西。我認為人形機器人的許多基本要素都在那些彈簧單高蹺的東西中。確實，當我們開始建造機器人時，波士頓動力公司是直立的，有兩條腿，兩只胳膊。有時領先。如果你看看公眾的反應，你會發現 YouTube 點選量增加了 10 倍，我非常關註這些點選量或評論，或者只是人們的態度。人們非常感興趣。普通的非科學家，比如說，非工程師，他們對人形機器人很感興趣，而狗惹惱機器人卻得不到同樣的贊譽。

熊友軍： 我是從讀博士的時候，2000年開始做機器人的研發，當時讀博士的時候，那時候更多的是做工業領域、特種領域的一些機器人，用在一些危險的環境裏面，因為那時候機器人技術還是非常不成熟，但在很多特種領域和危險場景裏面，是需要用機器人去完成工作了，然而那時候機器智慧實際上是很差的。所以我們當時想的辦法，是將機器人的智慧跟人的智慧結合起來，所以做了一些機器人要操作的一些事情。

北京具身智慧機器人創新中心總經理熊友軍

但在遙控操作完成這些工作的過程中，我們發現有很多的場景，實際上用輪式的工業機械手臂是解決不了的，尤其是有時候在一些特種場景環境比較狹小，然後環境比較復雜的輪式，然後履帶式實際上根本就進不去，但是人是可以進去。還有一種，是要試用很多工具去完成那些工作。

所以當時我們就覺得，如果說有微型機器人的話，實際上應該是能夠提供很好的解決工具，或者一種解決方案，但是我們當時那時候也看到了日本本田ASIMO，給我們提供了很多的一些啟發，所以那時候我就對人形機器人非常感興趣。後面畢業之後，一直在做機器人相關的工作，

2012年，我跟優必選科技CEO周劍先生創立了公司，做人形機器人研發工作，去年從深圳到北京開始籌建具身智慧機器人創新中心，現在也是一直在聚焦人形機器人方面的研發，主要的想法是希望說能夠解決人形機器人方面的一些共性、關鍵的技術問題，比如本體的一些基礎研發不足，其實我們現在微型機器人在本體在關鍵的核心器件，然後在一些傳感器方面其實上有非常多要攻克的地方。另外在運動控制，實際上我們也做了非常多的運動控制的技術研發，采用深度學習強化學習的這種運動控制的方式，包括現在也用一些融神經網路的一些方式用去做運動控制，同時其實我們現在還在做關於智慧方面的一些研發，比如說把用現在具身智慧的方式，做一些基礎性工作，比如建它的數據集，研發機器人大模型框架等。所以這就是現在我在做的一些事情。

陳建宇： 其實這個興趣是很小的時候，就一直對智慧機器人非常感興趣，我印象很深刻，剛剛興興說她10歲的時候，我估計也是差不多類似的時間，不過當時看的不是波士頓動力，當時關註的是ASIMO系列機器人，當時我就非常的去著迷。然後我覺得，創業這件事其實是充滿了挑戰性的，marc創辦了波士頓動力做了40多年，其實我是非常尊敬的，就是說你沒有一個發自內心的、天生熱愛的話，其實很難去堅持下來的。所以對我來說，對這類機器人的熱愛，我覺得某種程度上是從小就具備就擁有的。

那麽真正開始做機器人其實是本科的時候。當時在學校裏面，我就接觸真正意義上的機器人的研究，當時接觸了雙足機器人，主要是做的就是捕獲點步態規劃相關的研究。後來，博士階段繼續做機器人，雖然不是人形機器人，但是也是相關的一些機器人的領域，控制它的學習，包括無人車和機械臂。而真正的去全力做人形機器人，是在我回國之後，然後在現在清華正式投入去做人形機器人，還孵化了星動紀元公司，如今我們已經做了最新一代、第六代機器人了，然後我們也在展會上面帶來了我們機器人的實物，歡迎大家去關註。

王興興： 大家好，我是宇樹科技創始人王興興，剛才有提到我大概可能10歲的時候就看過marc先生在MIT實驗室做的雙足，還有單條腿的機器人，然後印象非常深，在09年、10年的時候，大概大一寒假，我就做過一個小的人形機器人，然後當時做的不是特別滿意，然後後來的話，就在研究生期間做了XDog這款機器人，差不多在13年到15 16年，這款機器人的話又采用了比較低成本的硬體，然後運動效能非常好，可以直接實作關節的力控以及整機的力控。

後來的話，一開始我對人體機器人的技術還是跟相對來說比較悲觀的，但是後來的話在2022年左右，整個的機器人、AI技術的進步，然後再加上ChatGPT出來以後，大家都看到人形機器人和AI結合的可能性，所以說我們公司又重新開始做人形機器人。說實在的，其實我真正感興趣的並不是說人形機器人，而是新的一個智慧體機器人的形態。而人形機器人可能只是說目前大家比較公認的、一個最有可能性的通用機器人和通用AI的結合體，但是這可能並不是個唯一的，我真正希望能誕生甚至更比人更高級的一個智慧體形態，可以大大推動整個人類工業的變革，推動新的工業革命。

王鶴： 我是北京大學電腦學院助理教授，也是北大銀河通用具身智慧聯合實驗室的主任王鶴，那麽，我跟人形機器人、具身智慧結緣，主要是從我在史丹佛大學開始讀博的時候。那麽2016年的時候，當時深度學習技術已經出來了，也套用在很多影像辨識分類這些任務當中。那麽當時作為一個前沿研究，我們試圖去理解人類是如何把感知思考還有互動的能力融合在一起的。

所以我博士期間的第一個工作，就用一個視覺模型來看桌面上人的動作和物體的一個運動，然後推理人下一步想要什麽，這是一個語言模型。

最後再用一個簡單的機器人，智慧的馬克杯去響應人的動作，那麽這個工作獲得了歐洲圖形學的最佳論文提名，但是我們認為它非常的不足，就是我們的一個馬克杯只能在桌面上移動響應人的動作，它沒有跟人互動的能力，我們的視覺只能看有限的幾一種物體，那麽我們的語言模型只能根據這個人跟這些桌面東西的一些動作來做簡單的推理。

那麽透過過去8年我們的研究，在怎麽樣把機器人的操作能力搞得更泛化，什麽東西都能抓，都能夠放置，那麽還有跟現在的多模態大模型技術結合，真的明白人類想讓你幹什麽，那麽言出法隨的去執行，所以去年我們就孵化了北京銀河通用這家人形機器人公司，我們現在也是把視覺、語言、動作這三種不同的模態融合到大模型當中，真正的賦能人形機器人，讓人形機器人能夠走進千行百業、千家萬戶，這是我們的願景。

問：你認為，我們今天擁有的哪些重要技術是 10 年前沒有的，但對於實用的人形機器人來說卻至關重要？它們在未來 5 年將如何發展？

Marc： 我認為硬體開發仍將非常重要。如果我們談論未來 5 年，毫無疑問，能夠打破語意理解障礙的基礎模型或其他人工智慧方法將產生最大的影響。

波士頓動力創始人Marc Raibert

我認為，人類可以做的就是，概括和理解他們所看到事物的含義，而目前還無法真正捕捉到這些含義。我相信，如果人工智慧能夠在這方面取得進展，我認為它將產生巨大的影響。

實際上，過去十年來，每個人都在電腦、傳感器、感知、控制等方面取得了巨大進步。電池，我認為人們忘記了電池。雖然電池是工業時代的產物，但是它們確實非常重要。是的，所以在電機方面過去 5 年裏，人們做得很好，我認為電機已經取得了長足的進步，當然，我們將看到更多。

陳建宇： 我從AI的視角來講一講，覺得非常大的一個不同。如果按照10年前的話，其實是2014年左右，當時是DeepLearning剛剛出來不久，它其實解決了很大一部份，比如影像處理等等一些問題。

那麽後面，其實有我認為兩個最重要的裏程碑：一個是以16年Alpha狗為代表的深度學習，緊接著把它用在了強化學習上面，做深度強化學習，解決了一些問題；第二個是以ChatGPT為代表的大語言模型，所以這點我認為是過去10年沒有的，但又對未來我們人形機器人，或者是具身智慧起到非常大的決定性作用的兩個因素。

那麽可能在接下來的這幾年時間，這兩項技術會非常深度的跟人形機器人、具身智慧融合起來，但他們也分別需要經過一定程度的訓練，從而能訓練比較通用的一個模型，那麽我們也能解決更加豐富的物理世界的數據程式。那麽我相信，在接下來的5年，這幾項技術都能起到非常大的一個進展，我們可能會在5年內迎來「機器人的ChatGPT時刻」。

清華大學交叉資訊研究院助理教授、星動紀元創始人陳建宇

王興興： 對過去10年最大的，還是AI技術帶來的各種事情有更多的信心。我覺得除了 AI技術本身最大的點，對於人形機器人，對於整個社會共識的增加也是非常關鍵的，就是目前大家更加相信AI，更加相信人形機器人可以誕生更多價值，這在10年前是完全不能想象的，那時整個社會基本上對此都完全沒有信心。

另外一點的話，我覺得在未來5年，總體上是肯定整個 AI 機器人、AI模型變化會非常快，因為目前的AI真的是日新月異，大家可以用AI整合技術，去搭建各種自己的模型去做訓練，這整個已經變成一個非常的扁平化，以及容易操作的過程，其實很多人大家都可以參與進來，去做機器人模型並且去做訓練，所以我覺得。未來5年這塊的各種AI模型創新，包括更新的一些神經網路模型，包括脈沖神經網路等都有很大的一些機會。

王鶴： 我覺得10年好快，10年前是2014年，其實我們已經看到inbody的AI，甚至不是一個在西方的學術界比較popular的詞匯，那麽過去的十年，我覺得一大技術的進展，就是我們在具身智慧裏頭已經有一些技能實作了非常強的泛化性。

那麽以我個人的研究舉例，在抓取問題上，我們取得了比較長足的進步，那麽我們從只能抓方塊圓的這些特定形狀的物體，到基於三維視覺傳感器，我們可以抓不透明、不反光，也就是在深度傳感器裏頭能完美成像的這些物體，到我們最近的技術能夠預測透明、高反光、金屬、吸光這些非常有挑戰材質的物體，基於它去做泛化抓取操作。

那麽在今天的展廳，我們都接受觀眾給我們的各種形狀，各種材質隨便堆疊亂七八糟的物體，我們的機器人都展示了非常泛化和高成功率的抓取能力，那麽現在的問題是，像這樣的每一個技能，大家都在分分別的去做開發，那麽很多人會提問你能幫我抓水瓶，你能不能幫我把瓶蓋給擰開？我非常不好意思的說，現在泛化的開瓶蓋技能我們還沒有訓練出來，這個就是大模型能夠帶給我們的機會，那麽大語言模型湧現，也就是這種緊急行為緊急行為，他能夠在只見一次或者是第一次零次的演示的情況下，他都理解你要生成什麽樣的文字，我們相信未來的5年給我們的機會就是發展機器人基礎大模型，它能夠實作湧現能力，它吞吐足夠量的數據後，有靈巧手，它能夠抓能夠加、能夠擰，能夠掰各種基本的手的各種運動能力都有了以後，他能湧現，我們給他看一個視訊，他就能理解這個活怎麽幹，到那個時候我們真正的就有一個通用的、至少做操作任務的的機器人了，這是我認為未來5年的一個機會。

熊友軍： 我覺得這一輪的機器人技術的進步主要是由AI來驅動的。毫無疑問， AI驅動我覺得體現在幾個方面。

第一個就是它人機互動效能得到了極大的提升。我記得10年前我們做人工智慧、做機器人的時候的那些互動，如果說我要加語音加視覺，第成本非常高，第二個我們要做大量的研發的工作，我們需要幾個博士、碩士帶著一個團隊，花很長的時間才能夠完成一些物體辨識、語音合成，自然語言理解NLP，還有甚至是TTS、語音合成等方面的一些工作，甚至包括導航，但是我覺得，現在隨著技術的進步，我們現在做人形機器人的大模型，我們直接一個端到端的直接語音給指定給他，然後很快他就可以有比較好的行為輸出，有很好的意圖理解，然後做任務規劃等。這是一方面，我覺得這一輪對人機互動、對動物的規劃、對執行等方面都有巨大提升，在10年前基本上都很難去想象。

然後第二個現在的這些硬體方面也有極大的提升，體現在兩個方向，第一個現在關節的效能的提升是非常快的，大家可以看到很多公司機器人可以開始去做一些非常動態的、劇烈的運動，實際上離不開關節效能的提升、高能量密度比，然後高的轉速、高效能等這些技術的提升，實際上，在10年前我覺得是很難去做到的。當然了這也有運動控制能力的提升、電機的提升，現在其實也有采用更多結構設計的方式，更適合它的布局等方面都有非常大的進步，包括把腿的轉成慣量、把電機往上提等等，有各種各樣的結構設計的技術的變化。

另外，剛才還提到能量，其實早前我覺得10年前我們做機器人的時候，一個電池就像我們背後要背一個非常巨大的電池包能源包，而且能夠持續的時間很短。但是這幾年隨著新能源汽車對電池技術的推動作用，其實我們看到它的電池能量密度大幅提升，我現在一個比較小的電池，可以支持比較長的時間，我覺得這是一個非常重要的技術突破。

未來，我覺得5年之後，這幾個可能還是一個重大、要突破的方向，像剛才說的人機互動方面，我們希望大模型能提供更長期的任務規劃，然後做意圖理解等等方面，我覺得我們能只要給他一個非常模糊的指令，他就可以給我們輸出我們很標準的很自然的這種互動的結果。第二方面，可能就是在規劃實施任務方面是一個非常重大、要攻克的方向，我們環境會經常變，面對的是一個動態環境，然後機器人能夠根據環境變化，能夠即時去改變它的一些執行策略等。當然，像能量方面我覺得是一個持續要提升的，它畢竟現在能量執行效率和我們人相比，還是有非常大的一個差距。

問：大規模部署人形機器人需要完成哪些任務？

Marc：但是如果你現在從更宏觀的角度來看，我剛才說了如果你想致富你現在就不會著手開公司，但是如果你想生存下去。你至少也得收支平衡。

我想這是一個更長遠的計劃，我認為要想取得真正的進步，你必須暫停，或者我不是說你必須暫停，我們在我的研究所暫停，讓機器人更可靠的本地目標將是一件關鍵的事情，如果我能指出舊金山的自動駕駛汽車，他們殺死了一個人，這實際上甚至不是自動駕駛汽車的墜落。然後克魯茲完全結束了舊金山。我知道現在還有很多事情在進行，但這在機器人領域很容易發生。因此，可靠性是一個關鍵因素，這是人們投入大量資源努力解決的問題之一。但這無助於解決，將我們帶入下一代的更大問題。當我說我不認為每個人都必須專註於你所說的真正有用的東西時。

陳建宇： 要做到大規模套用的話，有非常重要兩個事情：一個是能不能找到大規模的需求，另一個能不能有我們技術，足夠去實作、滿足需求。

其實作在有很多零散的表演需求，如果需要真的達到max（大規模）的話，我覺得主要還是看勞動力，非常密集的一些產業，比如三個階段，一個是工業、商用和服務。

大體我認為，技術也基本上是按照這樣一個方向去成熟發展，其中我覺得給我的感受，我認為工業的話可能會比較快就能夠去用上了。其實剛才Marc的報告中裏面也已經展現出來了，不管是人形，還是一些輪式的機器人，在工廠搬運的這一類的環境裏面，已經是達到了非常接近人類的一個節點，那麽在未來，它可能會更快更強大，然後以及成本更低，達到這個時候的話，其實它的第一個大規模套用的點就到了。

王鶴：我覺得具身智慧今天不能講完全成熟，但是我們今天GPT能力搭配人形機器人，其實已經能夠在很多場合幹事情了。

像我們今天在展台展示了就是在一個零售的場景，那麽使用者可以下單，我們的機器人可以根據你的具體下單的內容，是拿一個冰紅茶，還是拿一個巧克力，那麽我們從貨架把它取下來，同時我們也可以從地面的籃子裏頭把這些貨不斷的上到貨架上，我們也可以從更大的一個倉儲的料架上，抱著一箱東西放到傳送帶上。

這些場景其實都展示了， 目前具身智慧對於比較糙的活，就是抓取放置和雙手抱持這樣的能力已經走向成熟。

在這種情況下，我們還要問一個問題，為什麽是這個人形對吧？有很多人現場問我，你們為什麽要做成人形？因為你想如果貨架上的一個商品掉在地上了，我的機器人得有能力去夠地面這麽低的東西，我的貨架可能兩米高，我要能夠抓到兩米那麽高的東西，同時我還能還得來回走動，還要得有兩只手才能抱住一個箱子，又有兩只手又能高又能低又能夠來回走，那麽它基本上就把形態往人基本上非常的靠攏了，那麽我們目前用的是一個輪式底盤，沒有腿，那麽也已經達到這樣的一個能力了。那麽我們認為像這樣的抓取放置搬運的能力，在很多行業，比如說零售，比如說工廠，比如說一些服務的場景全都可以用起來。

北京大學助理教授、銀河通用機器人創始人王鶴

所以我判斷，人形機器人的大規模套用，2025年、2026年我們將見到從百台級到千台級的一個快速的增長，

王興興： 我個人的話，總體來說，對目前整個人形機器人套用落地還是需要一些時間，但當下，包括今年和明年對一些簡單場景，像特斯拉場景裏面把一個電池從什麽地方裝到什麽地方裏面，這種簡單的，用模仿學習能做的事情，目前的AI技術其實成功率還是做的比較高了，今年或明年可以做一些套用，包括把整個的GPT速度也提升。

但是我覺得，真正要提升人形機器人大規模套用，確實還需要更多的時間，把機器人的模型本身做得更好一點，讓它更通用，基本上無論是更精細化的或者更泛用心的一些事情都可以做一起來， 所以我還是希望社會大眾對AI和機器人能更多一些耐心。但 實際上可能中國其實還是有很多人比較心急的，我覺得還是大家可以再多給一點耐心。謝謝。

熊友軍： 我覺得人形經濟和大規模的套用，其實上這個就涉及到一個商業化場景選擇的問題，實際上，並不是說現在人形機器人不能夠套用，而是說要再看什麽場景。我覺得在有一些剛需的場景，或者對人不可達到的這種場景，還是有一些可以用的，尤其是這種剛性需求的，比如搶險救災，特種的對核放射線，或者是說有毒有害瓦斯環境等等，這些我覺得現在實際上是可以用的。

大家其實想的更多是，技術怎麽去提升，然後怎麽它能夠讓人形機器人能夠快速適應更多的場景，然後把成本快速的降下來，只有這樣透過一方面透過技術的提升，提高有更多工作效率，讓人有更好的體驗感，然後更多人願意用它。

第二方面，就是把成本繼續往下降，我覺得讓大家更買得起，這個我覺得要是要想的這個方式。

另外我覺得還有一種，就是商業模式上的探索，實際上人形機器人是我覺得是一個集大成者，它基本上涵蓋了機器人和人工智慧的絕大部份的技術領域，然後在人體技術上的研究能夠大大的推進這些技術的成熟，然後技術甚至技術的市場化，我們可以采用「沿途下蛋」方式獲得這個商業的利潤。透過這些其他的一些技術，人形機器人產品上孵化的其他技術商業化、產業化來推動人形機器人研究。一個典型的例子，就是我們現在有一些人形機器人公司已經在其他產品上實作盈利，然後已經實作了一個很好的商業化，這我覺得是一種非常好的模式。

問：作為技術人員，我們是否意識到有很多機器人都有道德倫理方面的顧慮——我們如何才能消除這些顧慮？

Marc： 我認為，從最高層面來說，理解所有技術都涉及一些風險和機遇是很重要的。我參加了一個政府會議，但我聽到許多政府的人都在談論監管人工智慧，而壓倒性的感覺是關註最糟糕的結果，對嗎？

比如在歐洲，來自英國一位人士在發言，讓我印象深刻的是，人們幾乎陷入恐慌，擔心最糟糕的事情會發生，並且不惜一切代價想要阻止這種事情發生。但我認為，不利用機會的風險與讓壞事發生的風險一樣大。

所以我認為，正如開發人員指出的那樣，我們需要找到一種平衡，當我們撰寫論文時，我們會在開頭列出這些內容。這些都是我們工作可能產生的巨大影響，但我們從不談論我們的工作，可能產生的壞事是什麽。

我們需要誠實和開放，更加公平地對待這個問題，但隨後繼續強調這種平衡，並以某種方式防止我們錯過機會，我認為由於公眾的恐懼，這種機會很容易發生。

陳建宇： 我覺得人們對這個人形機器人、或者相應的具身智慧機器人技術的擔憂，其實核心來自於對自身安全性的一個擔憂。

安全其實有幾個不同的層次，最底層的層次是物理的安全，大家擔心機器人會不會在工作的時候去傷害到人，那麽這是一個層次；當然其實在它分情況，那麽比如說我們剛才說的如果是工廠裏面的話，其實如果我們把它跟人工作環境隔開，其實一定程度上能解決這個問題；同時，我們也需要從我們的演算法硬體等等上面做的更魯棒來去最佳化這個問題。

那麽第二個層次，其實也是生存上面的問題，但是不是說實體層面的，那麽也是不是說全人類的一個擔憂，而是說有一部份人一個擔憂，他擔心這個會替代咱們的某一些工作，大家會有擔憂，我覺得這個事情可能需要政府或者商號進行有一些引導，我們盡量的開始去做一些確實勞動力非常緊缺的這樣的一些產業，比如說我們一些非常惡劣環境工業環境，或者是比如說養老等。

當然第三個層面，如果未來我們的具身智慧機器人真正擁有了意識，那麽這個會對人類的自我存在的價值可能產生一些擔憂，我覺得這個事是更遠的和更大的topic。

王興興： 我覺得機器人的倫理道德和安全性問題，是非常重要的一件事情，而且我覺得，要希望是在場所有的人都大家需要共同去維護的一件事情，就有點像現在新能源汽車以及無人駕駛，它其實還是有很多安全性問題，並且比如說有一輛早些年新能源汽車起火了，或者有一家新能源汽車無人駕駛出了交通事故，這個對整個行業影響是非常大的，會降低普通老百姓對技術行業的認可度以及信心。

這個事情很容易發生在人形機器人和AI這個領域。所以我一直覺得。當下以及未來大家都應該在機器人安全性上，無論是出台一些規章政策，或者做一些更好的引導，或者需要全世界政府出台一些相關的政策，都共同推動整個行業的健康發展。

Unitree Robotics（宇樹科技）創始人、CEO、CTO王興興

王鶴： 所以我就從技術的角度，人形機器人它的一個面向終局的技術必然是大模型，那麽其實只有大模型才可能實作非常高的通用性，把很多能力全部匯集在一起，把很多模態，從視覺感知，到語言理解，到動作執行，那麽融會貫通，那麽今天我們在技術上其實是有方法對大模型的行為進行限制，就是「對齊」，我們在大模型內部已經進行了深入研究，那麽未來，我們會對語言模型、多模態模型進行更深入的對齊，讓它不會傷害到我們的人類，並且他的技能會被局限在服務的範疇內，那麽這一些是我們技術上能做的，在技術上之外，必然還需要政府社會和國際的合作。

熊友軍： 我覺得前面幾位都說的都挺好的，我就補充一點，就是說我覺得應該是有一些行業組織或者是政府出來，更多在法律法規這方面更多的立法，包括更多的是做全社會的機器人使用、倫理道德方面的一些教育。因為我覺得，任何一個機器人也是一種工具，放在不同人的手上，它的可能有不同的使用方法，然後只有加強教育，提升大家對人工智慧對人形機器人的使用，讓大家相對安全形度去考慮，我覺得才是一個正確的方式。

問：您認為 5 年後人形機器人行業會發展到什麽程度？哪些經濟領域將率先使用它們？

Marc：不，我認為人形機器人的出現讓事情變得復雜。我認為機器人在工業領域的套用將取得很大進展。我認為機器人的套用非常廣泛。人們對此非常關註。正如大家所說，使機器人變得越來越好的技術確實正在日趨成熟。我認為工業將繼續取得進步。

我認為人形機器人本身總體上仍然非常不成熟。 所以我看不到它們。我知道你可以看看一些人形機器人公司與汽車公司合作的演示。我認為這在某種程度上是一種炫耀，而不是一種生產力。我不知道這是不是題外話。如果你看看倉庫機器人，你會發現最大的挑戰之一是系統整合，特別是如果它不是圍繞機器人設計的全新倉庫。

我認為許多倉庫機器人供應商都在苦苦掙紮，因為他們需要一個系統整合商，而這個系統整合商會消耗掉太多的預算，因此很難賺錢，這是因為營運倉庫的 IT 人員並不想開放他們的系統。在那裏工作的人並不想改變他們現在做的一切。如果機器人可以處理每一項任務，那就意味著他們仍然需要一個人來完成任務。使用任何型別的機器人對行業來說都具有很大的復雜性。我認為這些都是重要因素。

說實話，我原本以為 Spot 會取得更大的成功，但 Spot 的推出只是一次實驗。我們之所以設計 Spot，是因為它能夠讓你連線自己的傳感器，因為我們不知道人們想要什麽樣的傳感器。我們之所以設計 Spot，是因為它能夠讓你對它進行編程，因為我們不知道現在的使用者們都有哪些應用程式，而我們對它們的使用方式有了更多了解，開發人員正專註於巨大機遇，因此 Spot 對人們的接受度確實產生了影響。

也許如果我們沒有足夠的商人，能夠提前進入並評估它是什麽，我們實際上是在做一個實驗。也許人形機器人會有更好的記錄。

王鶴： 我覺得我對人形機器人的發展總體是比較樂觀的，那麽在未來5年，我們要完成真正的大規模套用，這件事情對於整個人形機器人仍然是一個先慢後快，其中慢的階段，那麽一個裏程碑應該是——在5年的時候我們能達到萬台人形機器人級別的套用。

這樣的一個市場大約是對標現在商業清潔機器人。我們舉個例子，在超市在萬達廣場在寫字樓一層，我們看來回去洗地擦地的機器人，那麽領先的這個市場，中國最領先的公司大約是每年出貨1萬台，那麽他做的事情不局限做這麽簡單的事情，它能達到在各種場景，不管是商超還是寫字樓，還是很多不同的場景進行清潔，但是當然是平面清潔。

那麽，對於我們人形機器人來說，我們希望能做到一個立體操作，但是它的能力可能是局限的，我搬運我就是上貨，我就是取貨，對吧？

我沒有更多的能力，但是我也要實作跨場景的套用，可以在超市裏、可以在工廠裏、可以在服務場景等等。那麽能達到5年1萬台的市場規模的話，我相信後面有真實世界數據的回流，那時，我們會看到人形機器人套用規模會加快，從慢時代進入快時代。

熊友軍： 人形機器人我對它的套用可能會更加樂觀一點，其實大家看到這兩年人形機器人的進步非常快，尤其在AI驅動下面，實際上在市場套用方面，你們已經可以看到國的有一些企業，包括全球企業已經開始在一些場景裏面做試點套用了。

比如說在汽車廠，比如在一些商用服務場景，已經開始做試點，隨著這個試點數據會形成一個飛輪的效應，所以試點進展，然後它會有更多的叠代，然後有更多數據驅動，機器人會在在一些特定的環境裏面提高效率，它的速度，它的隨著量的增長，它的價格會大幅的降低，這樣我覺得會更快的去促進產業的套用。

我覺得今年年底，大家應該可以看到，有一部份的公司已經能夠在一些比如說新能源汽車廠，比如說在一些特種領域已經開始套用，明年我覺得應該可以看到一些可能千台左右量級的出貨。

問：你能在我們的年輕觀眾中「點燃一把火」，讓他們也想成為「機器人專家」嗎？他們應該怎麽做？

Marc：我認為伊隆·馬斯克本人憑借他的雄心和資源，可能在幾年內推出10000個機器人，不一定是因為它們會直接讓機器人賺錢，但看看他對電動汽車所做的一切。他們從無人相信到現在，我比這裏的任何人都更加懷疑，包括我在內，到每家汽車公司都有淘汰內燃機的計劃。

我認為這是一件了不起的事情。他似乎對此很認真。所以這在整個人形機器人領域都是一個真正不確定性的因素。 我不確定如果他沒有抓住機會，是否會有這麽多人形機器人。

我認為機器人玩得越有趣，人們就越能與它們互動。我到處走走，我沒有帶機器人來這裏，但這裏有很多機器人，但我到處發表演講，發現機器人在計劃中相當無聊。你總是能吸引一群人，只要你願意讓他們與機器人互動，他們就會留下來。我認為我們做得越多，公眾就會越熱情。我非常欣慰，參加這次活動最令人興奮的事情可能是有很多人說你做的工作是我十幾歲時見過的，現在我正在做。我們越能展示我們的工作並激勵下一代，這就會實作。

陳建宇： 我的一個建議是，因為機會其實永遠是留給有準備的人，那麽像Maec做這個事情做了做了好幾十年，然後包括我們其實台上我們幾位也都是多年深耕在機器人或者相關領域，所以說，因為人形機器人它其實也是一個非常長周期的事情，同時它也包羅永珍，從技術上的軟體、硬體、AI再到商業、產品等等，其實各方面都有，所以說大家應該去問一問自己的內心在這一步範圍內到底自己最有激情，最喜歡的最熱愛的是什麽？然後從此刻開始就去積累它。最後，要麽等待未來，要麽總有時刻你有施展自己的機會。

王興興： 對於我覺得對於所有年輕人，包括我們其實這個時代都是非常精彩的，而且想象一下，大家也知道AI、機器人都是階梯性發展，就像GPT沒有出來之前，大家覺得語言模型沒什麽用，基本上是非常差，但突然就是發生了巨大進步，非常好，其實機器人、AI也會遵循這種規律，所以大家現在可能看到機器人的 AI 能力都比較弱，但實際上這是好事，為什麽？因為大家都有機會去做的更好，可以真正的把這種人類目前可以預估的最偉大技術，就在當下，就在未來幾年，所以這個事情都是非常值得做的，

而且，在機器人和 AI 另外一個比較適合年輕的點，它沒有那麽多歷史包袱，不像數學領域，有幾百上千年的非常天才的數學家，你一定要比他們做得好，你才可以做技術，但是當下，AI 和機器人它都非常年輕，尤其 AI 技術就最近幾年的東西，所以非常適合年輕人。我一直感覺在如果在未來5年到10年或者幾十年回看我們現在這個時代，所以想想這種感覺，真的非常激動人心。

王鶴： 我覺得其實未來的15年，在我心目中會是人形機器人，從當下在產業中沒有規模化套用，到可能成長到跟今天汽車的產量一個萬億市場的過程。那麽在這個過程中，其實對年輕人來說，那麽我覺得大家就是做好自己就可以了，因為15年之後很多工作都是跟人形機器人相關的，今天可能你負責賣車，那麽15年後，你可能崗位就調到賣人形機器人對吧？今天你是班級裏頭的佼佼者，那麽你學 AI ，那麽你可能發現你的職業生涯就是圍繞著進一步提升人形機器人的能力展開的，所以大家做好自己，我們一起共享光明、人形機器人的未來。

熊友軍： 其實我是經歷過個人電腦時代，我經歷智慧型手機時代，我經歷過行動網際網路的時代，現在其實我們正在經歷智慧汽車的時代，電動汽車的時代，我覺得下一個時代實際上就是聚生智慧的時代，而聚生智慧時代的典型代表其實就是人性機器人，所以我給現在的年輕人建議就是說保持野心，懷揣大夢想。

問：讓我們在小組成員之間花幾分鐘時間討論一下：你們想要互相問什麽問題？

陳建宇：所以我想問Marc，你認為對於機器人和人工智慧來說最重要的研究問題是什麽，例如，如果你只能選擇一個研究計畫，那麽你選擇哪一個？

Marc：讓我從側面回答一下，這也是一種回避你的問題的方式。最後我沒有展示我的最後一張投影片。我的最後一張投影片是一個展示機器人故障的視訊。它展示了，我不知道它大概有 2 分鐘長，可能有 25 種不同的故障。我認為故障是工作中最有趣、最有意思、最有用的部份，關註它們，然後在你的工作不工作的時候繼續前進，這真的很重要。這不是研究的主題，但它是一種工作精神。所以如果我要問你們所有人這個問題的話，那就是我還沒看到任何人在演講中提到過事情無法正常運轉，而且我敢肯定，單一機器人不會在不發生碰撞的情況下完成那些後空翻以及它們所做的所有很酷的事情。你喜歡碰撞嗎？

王興興：Marc先生，很榮幸今天見到您，我其實想有好奇想問一下，您覺得對於人形機器人的手，您覺得未來幾年比較合適的有幾個手指，或者幾個電機，這會是比較好的一個方向？

Marc： 再次，我要回答一個略有不同的問題。我們研究所最近舉辦了一場研討會，名為「對操縱的反向觀點」。我認為靈巧性確實很重要，但基本上它並沒有取得很大進展，盡管人們至少已經為此努力了 50 年。我認為我們必須以不同的方式思考，再次嘗試不同的東西，就像我今天在演講中開始的那樣，也許我們需要更多的動態操縱，而不是所有的靜態抓握。我認為很多學習界的人在提出他們正在學習的靈巧性的要求時對自己要求不夠。他們做的事情很簡單，很容易。

我認為那裏是有機會的，有多少只手我不知道有多少根手指。我認為五個已經很多了。 但也許有一天我會覺得更有趣的問題是手掌怎麽樣？我們的手掌功能非常強大，它們不僅僅是靜態的塊。而且你看到的幾乎每個機器人手都有許多手指在做這件事，但僅此而已。

王鶴： 之前我提到過，大概 15 年後，世界上會有數百萬、一千萬個人形機器人。如果人形機器人具有通用目的，那麽人形機器人是終極體現，那麽這種通用目的的終極技術是什麽？對於人類噪音，您是否認為視覺、語言、動作模型，這些端到端模型是人類噪音的終極技術或方法？

Marc： 我很難相信，端到端是取得進步的方法。也許最終在漸近線上端到端是正確的方法，但我認為我們知道的太多了。

說實話，我認為人們過分看重（機器）學習。我知道應該對學習持樂觀態度，但如果你看看當今存在的解決方案，你會發現最好的解決方案中學習所起的作用微不足道或微不足道。當然，在波士頓動力公司，今天學習很少，盡管人們正在努力。我認為控制系統、控制理論、觀察器，這些在過去 20 或 30 年建立起來的東西仍然發揮著巨大的作用。

我不想就這樣把它拋棄。我希望我們能真正擁抱學習，但要把它與我們已經知道的東西結合起來，找到一種方法把它們結合起來，至少在接下來的5年或10年裏，也許在漸近線上，情況會有所不同。

熊友軍： 我的一個問題是，Marc作為波士頓動力的創始人，您之前開發了像Atlas這樣的非常令人驚奇的這種產品，但是我們前不久我們看到波士頓動力終止了這個機器的研發，然後由原來的液壓驅動，轉向純電驅動的這種方式。對這方面是出於什麽樣的考慮？是因為成本的考慮，還是因為出於商業化的考慮？同時我還想知道，波士頓動力未來5年的一些這種計劃，對商業化的一些計劃。

Marc： 我認為，如果你問為什麽要進行轉變，我認為有兩個關鍵因素：一個是液壓機器人，我喜歡液壓技術，我會用液壓技術制造很多機器人。我認為，建造人形機器人或類似人形機器人仍有空間，它們將繼續使用液壓技術，因為重量和強度等因素。

但我認為有兩點。一是它們很麻煩，至少對於像 Atlas 這樣的高效能機器人來說，盡管我們付出了無盡的努力，也永遠無法讓它們完全不漏油。當你把石油機器人放到工廠和家裏時，它們就不能滴油；同時，很難找到精通液壓技術的人，因為人們認為這是非常古老的東西，盡管 Atlas 在液壓工作原理方面有很多創新，從伺服器閥門到 HPU 液壓動力裝置，一直都是如此，確實有創新的東西在進行；最後，我認為電動汽車在規模上已經足夠強大，它們可以參與競爭。我不想代表波士頓動力發言，盡管我是創始人之一，並且仍然是董事會成員，但我認為他們必須有自己的計劃，說明未來的計劃以及技術的所有細節。我想隨著事情的發展，你會發現更多這方面的內容。

主持人： 非常感謝。我想觀眾肯定會有更多問題，也許吧，但我們的時間真的不多了。所以非常感謝各位小組成員。非常感謝觀眾的到來和聆聽。我認為這是一場非常精彩的會議，尤其是小組討論。我對組織者的建議是，我們明年再舉辦一次類似的會議，然後我們可以回顧進展和未來的步驟。

（本文先發於鈦媒體App，作者｜林誌佳）