OpenAI泄密者，投奔馬斯克

2024-05-07科技

白交衡宇發自凹非寺量子位 | 公眾號 QbitAI

剛被OpenAI開除的泄密者，光速投奔馬斯克。

當事人Pavel Izmailov （以下簡稱小P），正是Ilya盟友之一，在Ilya領導的超級對齊團隊幹過。

半個月前，小P被指疑似泄露Q*相關機密而被開除。雖然不清楚他泄密了個啥，但當時鬧得沸沸揚揚。

說時遲那時快，現在，他的推特個人簡介上，已經大張旗鼓寫著：

研究員@xai

要不說老馬招人下手快呢，除了小P，不少優秀人才近期都被馬斯克攬入麾下。

看熱鬧的網友炸開了鍋。誇他的人不少，稱他幹得漂亮：

也有人嫌棄死了，覺得僱用泄露機密資訊的人，這行為無異於撿垃圾。

而且最近xai的表現——包括釋出Grok 1.5V在內，狠狠刷了波存在感，不由得引人感慨：

xAI將成為遊戲的主要參與者，與OpenAI、Anthropic分庭抗禮。

聘請OpenAI開除的泄密者

事情是這樣的，有個對大模型領域新鮮事兒極其關註的博主，有了個大發現：

馬斯克旗下xAI的新晉員工，可不少啊？？？

而且其中還有數人研究方向與OpenAI最神秘的Q*演算法有點關系，看來馬斯克才是Q*的真正信徒。

具體是哪些人剛剛擇xAI而棲了呢？

最為矚目的就是咱們開頭提到過的小P。

他還是紐約大學CILVR小組成員，本人透露2025年秋將加入紐約大學Tandon CSE、Courant CS擔任助理教授。

半個月前，他的個人頁面還寫著，「在OpenAI搞搞大模型推理工作」。

半個月後，物是人非。

但小P的推特置頂還是沒有改變，是超級對齊團隊的第一篇論文，小P是這篇論文的作者。

超級對齊團隊組團於去年7月份，是OpenAI為應對不同時間尺度上大模型可能會產生的安全問題，成立的三大安全團隊之一。

超級對齊團隊負責遙遠的未來，給超越人類的超級智能安全性奠定基礎，由Ilya Sutskever 和Jan Leike 領導。

說起來，雖然OpenAI看起來似乎在安全方面很重視，但其內部對AI的安全開發存在很大分歧已不是什麽秘密。

這種分歧甚至被認為是去年11月OpenAI董事會宮鬥大戲的最主要原因。

網傳Ilya Sutskever成為「政變」帶頭人，就是因為看到了一些東西讓他內心不安。

而Ilya帶領的這個超級對齊團隊，很多成員也是站在Ilya這邊，在後來支持柯曼的比心接龍活動中，這個超級對齊團隊成員也基本保持了沈默。

然而宮鬥事件平息後，Ilya仿佛在OpenAI蒸發了一般，惹得外界流言四起，但他再也沒有公開露面過，甚至都沒在網上進行澄清或辟謠。

因此，超級對齊團隊現在是個什麽情況，咱也不知道。

小P作為超級對齊團隊成員、Ilya部下，半個月前從OpenAI被畢業，被網友猜測是柯曼的「秋後算賬」。

人才啊，他連夜投奔馬斯克

雖然外界還不知道Q*的全貌，但種種跡象表明，它致力於把大模型與強化學習、搜尋演算法等結合起來，增強AI推理能力。

除了最有八卦點的小P，下面幾位新加入xAI的人才研究方向多多少少與之相關。

Qian Huang ，目前還是史丹福大學的一名博士生。

去年夏天開始，Qian Huang在Google DeepMind工作，目前推特上已經註明了@xai，暫不知擔任什麽職務。

但從GitHub個人主頁可以看到，她的研究方向是將機器推理與人類推理結合起來，特別是新知識的合理性、可解釋性和可延伸性。

Eric Zelikman ，史丹佛博士在讀生，推特上寫明「study why @xai」。

之前，他先後在Google研究院和微軟研究院待過一段時間。

他在個人主頁上說：「我對演算法如何（以及是否）能夠學習有意義的表示和推理很著迷，我正在xAI研究這回事兒。」

今年3月他所在團隊推出Quiet-Star演算法，確實也是Q*，讓大模型學會自己獨立思考。

Aman Madaan ，卡內基梅隆大學語言技術研究所博士在讀生。

他的研究領域包括大型語言模型、反饋驅動的生成以及程式碼生成和自然語言推理的交叉領域，研究的首要主題是使用推理時間計算（Inference-Time Compute）來增強推理能力（Reasoning）。

攻讀博士學位期間，Aman曾擔任Google大腦和艾倫人工智能研究所的學生研究員和合作者；更早以前，他還是Oracle的主要技術人員。

加上Pavel Izmailov在內的幾位新員工，自此馬斯克的技術人才版圖已擴增至34人（不包括馬斯克本人），相比於最開始12人的創始團隊增長了約2倍。

在新加入的成員當中，華人共計7人，加上創始團隊的5人，自此共有12人。

Xiao Sun，此前曾在Meta、IBM就職，博士畢業於耶魯，北大校友。 Ting Chen，此前曾在谷歌DeepMind、谷歌大腦就職，本科畢業於北郵。 Juntang Zhuang，此前曾在OpenAI就職，DALL-3、GPT-4核心貢獻者，本科畢業於清華，碩博畢業於耶魯。 Xuechen Li，今年博士畢業於史丹佛，羊駝Alpaca系列大模型的核心貢獻者。 Lianmin Zheng，UC柏克萊電腦博士，小羊駝Vicuna、Chatbot Arena建立者。 Qian Huang，史丹佛在讀博士生，畢業於天津南開中學。 Haotian Liu，威斯康辛大學麥迪遜分校，本科畢業於浙江大學，LLaVA一作。而從機構分布上看，主要還是集中於谷歌、史丹佛、Meta、OpenAI、微軟等機構，他們都有豐富的大模型訓練經驗，比如GPT系列、大小羊駝系列，以及谷歌Meta相關大模型。

從加入時間來看，更多還是集中在今年2-3月，平均每5天就有一名新成員加入共計13人。去年8-10月間只有5人加盟。

而如果結合相對應Grok的進展，也能看到馬斯克xAI每一階段招人計劃。

比如今年3月29日，馬斯克突然釋出Grok-1.5，上下文長度飆升，從原本的8192增長到128k，和GPT-4齊平。

而將時間推回一個月（今年2月），OpenAI前員工Juntang Zhuang加盟xAI。他在OpenAI發明了GPT-4 Turbo支持128k長上下文能力的演算法。

還有像今年4月15日，Grok-1.5V多模態模型釋出，它能處理除文本資訊外，包括圖表、螢幕截圖、照片在內的各種視覺資訊。

而今年3月，LLaVA一作Haotian Liu才剛剛加盟。LLaVA是端到端訓練多模態大模型，展現出了類似於GPT-4V的能力。而新版LLaVA-1.5 在 11 個基準上實作了SoTA。

那現在不妨可以大膽設想一下，新一波人才引進，Grok可能會有什麽樣的新升級呢？

網友：不管，Grok-1.5在哪呢（還沒開源呢）。

但是不管怎麽說，根據此前馬斯克所說的人才標準來看，這位網友道出了「實情」：

大家都說老馬家大模型公司都是人才，其實人家馬斯克根本不在乎你有才沒才的。人家說了，只要你能每周工作80小時還不崩潰，就能加入他們。

80個小時？！

量子位掐指一算，那不就是一周無休每天工作11.5個小時嗎……

別說智商了，這活從體力上咱就幹不了幹不了。

參考連結： [1]https://twitter.com/Pavel_Izmailov [2]https://twitter.com/jam3scampbell/status/1786149919041970683 [3]https://x.ai/about [4]https://x.com/emollick/status/1787593669618393299