OpenAI canvas一夜封神！AI編碼研究神器，ChatGPT再顛覆人機互動

2024-10-06科技

編輯：桃子喬楊

【新智元導讀】 ChatGPT橫空出世以來，首次迎來界面史詩級升級！全新canvas界面，開啟了人類與AI協作研究、編碼的新時代，更代表著終極AGI人機互動形態。

時隔兩年，ChatGPT終迎來界面全新升級！

這一次，OpenAI官宣推出canvas。它不再是簡單的對話方塊，而是能與ChatGPT「並肩作戰」的全新界面。

不論是寫作，還是編碼，都可以開啟全新的合作方式。

canvas基於GPT-4o構建，目前仍在測試階段，可在所有模型中手動選擇。

而且所有Plus使用者不用等待，直接可用。未來，OpenAI還計劃向所有免費使用者全面推出。

canvas不僅可以讓你與ChatGPT一起做研究，還能寫程式碼、信件等等，最重要的是還能幫你一起腦洞。

有趣的是，canvas還可以添加emoji。阿特曼線上發起投票，看看有多少人喜歡這個功能。

另外，canvas面板中，還多了一個快捷選單，讓協作更加輕易便捷了。

審查程式碼、修改bug、添加評論、log等等，一鍵完成。

在Canvas界面助力下，GPT-4o編碼效能飛躍18%！

這是要紛紛取代了GitHub Copilot、Cursor編碼神器了。網友們驚嘆道，OpenAI絕殺了Cursor。

還有人說，canvas的推出，是OpenAI對最大勁敵Anthorpic的Claude artifacts最大的回擊。

在經歷如此巨大人事變動同時，OpenAI近日多次釋出更新，是向外界、投資者給出了我們依舊有實力的反饋。

話不多說，看看歷經兩年，ChatGPT究竟帶了怎樣劃時代的巨變。

肝程式碼研究，原來這麽輕松

canvas計畫負責人Karina Nguyen表示，我對終極AGI界面的願景，是一張空白的畫布。

隨著時間的推移，它會根據人類偏好，自我改進。

而且，它會創造與人類互動的新方式，重新定義人類與AI，以及整個互聯網的聯系。

canvas便是，這樣一種終極AGI界面的完美「代言人」。

那麽，它究竟如何幫人類研究、寫程式碼、創作呢？

接下來，讓我們一睹為快。

做研究

當你需要完成一項藝術史研究報告，在canvas便可以完成研究。

首先，將你的需求告訴ChatGPT，它便開始搜尋一切所有相關的報道——Rembrandt的自畫像技巧。

隨之，canvas在螢幕右側開啟了全新界面，一篇研究報告，正在速成。

當你對其中生成的一句話，不太確定是否正確。只需要選中，然後即刻就能喚醒ChatGPT，隨地取問。

又或者，當你想要更改文中的小標題，不如讓ChatGPT給點建議。

最驚艷的是，右下角「鉛筆」樣子的圖表，可以開啟文獻的閱讀模式，可以一句一句地瀏覽。

最後，你可以讓ChatGPT為你添加參考文獻、書目參照。

寫信件

你還可以讓ChatGPT搜尋一家最好的餐廳，它會幫你匯總所有在SF城市米其林餐廳。

然後讓它在為你寫一封信件，發給最好的朋友。

寫程式碼

另外，你還可以在canvas界面中，完成程式碼的生成，還是可以編輯的那種。

以往ChatGPT只是給出結果，並不能一同編輯。

讓ChatGPT用Rust寫一API網路伺服器，它便同以往一般，為你生成了程式碼。

然後，要求對其中一段程式碼，添加登入註冊路由。

並且，你還可以自己覆寫其中的內容。

在界面右下角，還有一個工具列，可以進行程式碼審查、轉換語言、修改bug、添加log、還有添加評論功能。

比如，針對剛剛生成程式碼進行審查，以及修復bug，ChatGPT瞬間就完成了。

發明新食譜

更驚艷的是，在canvas模式下，還可以創造發明新的idea。

比如，你想做一個不一樣的蘋果派，可以讓ChatGPT搜尋總結出，最通用的蘋果派的食譜。

假設你沒有其中一種材料——Nutmeg（肉豆蔻），然後你們可以一同創作全新的做法。

與ChatGPT並肩作戰

目前，ChatGPT已常被用於協助寫作和編碼方面的任務。

盡管聊天界面易於使用並且適用於許多工，但對於需要編輯和修訂的計畫，仍然有些不便。

canvas的推出，正是要為這類工作提供新的界面，而且能讓ChatGPT更好地理解使用者提供的任務上下文。

當ChatGPT檢測到可能有幫助的場景時，canvas會自動開啟，也可以直接在提示詞中包含「使用canvas」的字樣來處理現有計畫。

對於寫作任務，快捷編輯列中包含5種選項，從下至上依次為：

- 建議編輯：ChatGPT為指定內容提供行內建議和反饋

- 調整長度：將文字內容編輯得更短或更長

- 更改閱讀級別：調整文字的閱讀難度，從幼稚園到研究生院

- 最後潤色：檢查語法、解析度和一致性

- 添加表情符號：為強調或有顏色標記的內容添加相關emoji符號

比如，可以高亮特定部份來引起ChatGPT的關註，並讓模型在考慮整個計畫的同時，提供行內反饋和建議。

阿特曼還發起了線上投票，「添加emoji是不是OpenAI有史以來釋出的最好功能？」

對於編碼任務，快捷鍵又和寫作不同：

快捷鍵從下至上依次為：

- 檢查程式碼：ChatGPT提供行內建議以改進程式碼

- 添加日誌（logs）：插入print語句以幫助偵錯和理解程式碼

- 添加註釋：為程式碼添加註釋

- 修復bug：檢測並重寫有問題的程式碼以解決bug

- 移植到一種語言：將您的程式碼轉換為JavaScript、TypeScript、Python、Java、C++或PHP

「點到哪裏改哪裏」，修改程式碼也將和修改文字一樣直觀簡單。

為什麽要更新使用者介面？

OpenAI在部落格中表示，如果要讓人工智慧變得更有用、更易用，就需要重新思考我們如何與它互動。而canvas，就是一種全新的方法，未來還將經歷快速叠代。

終極AGI界面canvas，GPT-4o也被最佳化了

為了讓模型更適應canvas模式，團隊也對GPT-4o進行了必要的修法，添加了一些核心行為：

- 觸發canvas的開啟，進行書寫和編碼

- 生成多樣化的內容型別

- 進行有針對性的編輯

- 重寫文件

- 提供行內形式的修改意見

值得一提的是，對GPT-4o進行的這些訓練采用了OpenAI的合成數據生成技術，包含了從o1模型中提取的輸出。

此外，團隊還使用了20多項自動內部評估來衡量進展情況。

首先，一個關鍵的挑戰是定義何時觸發canvas。模型既需要靈敏辨識有檢查、修改需求的任務，比如「寫一篇關於咖啡豆歷史的部落格文章」，同時也要避免過度觸發，比如「幫我做一份新的晚餐食譜」這種一般的任務就不太需要canvas。

與帶有提示指令的基線模型相比，調整後的GPT-4o的觸發決策正確率分別達到了83%和94%

第二個挑戰涉及在canvas被觸發後調整模型的編輯行為，特別是決定何時進行有針對性的編輯而不是重寫整個內容。

這就要訓練模型，在使用者明確選擇文本時，更傾向於執行有針對性的編輯而非重寫。隨著模型不斷完善，這種行為的能力也在不斷發展。

相比基線模型，帶有canvas的GPT-4o在寫作和編碼任務上有18%的效能提升

最後，訓練模型以生成高品質的程式碼註釋同樣需要細致的叠代過程。

這個評估任務與前兩種情況不同。canvas是否觸發以及是否進行了有針對性的編輯行為，很容易進行自動化評估，但以自動化方式衡量程式碼註釋的品質，因此團隊選擇了人工評估。

相比基線模型，整合canvas後的GPT-4o在註釋準確性方面有30%的提升，品質提高了16%。

這表明，與帶有詳細指令的零樣本提示相比，合成數據的訓練顯著提高了模型的響應品質和行為。

網友玩瘋了

canvas一經釋出，已在全網掀起熱議。

Every初創公司創始人表示，很明顯，OpenAI不僅僅是在構建聊天機器人，他們還試圖為AI時代構建一種全新的操作系。

一名開發者表示，canvas界面是遊戲改變者。

他剛剛透過canvas和ThreeJS一起建立了一個tesseract/Hypercube視覺化工具，並稱自己喜歡統一的UX聊天、線上評論和觀看GPT-4o在程式碼上發揮其魔力，所有這些都在一個地方完成完成，永不過時。

還有網友表示，canvas界面做的非常好，而且一切都是即時流暢的。

不過，它讓我們意識到一個重要的問題，我們還不確定與AI協作寫作的最佳方式是什麽。

話雖如此，canvas讓工作更加整合整合（cyborglike），而不是簡單地輪流進行任務（centaurlike）。

還有人紛紛悼念Cursor。

核心貢獻團隊

canvas背後核心團隊也隨之全部公布。

研究主管是Karina Nguyen，還有3位核心研究人員Kai Chen, Michael Wu, Tarun Gogineni，12位元核心工程/產品/設計師。

值得一提的是，提供支持技術領導人當中，還有離職的CTO Mira Murati。

Karina Nguyen

在加入OpenAI之前，Karina Nguyen曾在Anthropic任職，專註研究模型對齊能力和誠實研究，以減少LLM的幻覺。

值得一提的是，她曾領到了Claude Instant 1.2訓練，在API中制作了該模型。

此前，作為一名設計工程師，Nguyen與Primer.ai、Dropbox、Square和【紐約時報】的團隊在研發原型、新聞工具和產品功能方面進行了合作。

Kai Chen

Kai Chen在賓夕法尼亞大學獲得了電腦科學本科學士學位。

她於2023年初加入OpenAI，此前Kai Chen還聯合創辦了兩家公司，一個是AI助手領域的Dispatch、還有一家自動化勞動任務計畫的Port Tecjnologies。

Michael Wu

Michael Wu目前是OpenAI的套用研究員。

此前，他曾以套用研究科學家身份，在Facebook工作了三年，任職期間訓練了自然語言理解和深度學習模型。

此外，他還在Primer AI擔任機器學習工程師、Dropbox擔任軟體工程師，在Naver Corp擔任機器學習實習生，在蘋果公司擔任機器學習實習生。

2015年，Michael Wu在麻省理工學院獲得了電腦科學和數學學士學位。