編輯:桃子 喬楊
【新智元導讀】 ChatGPT橫空出世以來,首次迎來界面史詩級升級!全新canvas界面,開啟了人類與AI協作研究、編碼的新時代,更代表著終極AGI人機互動形態。
時隔兩年,ChatGPT終迎來界面全新升級!
這一次,OpenAI官宣推出canvas。它不再是簡單的對話方塊,而是能與ChatGPT「並肩作戰」的全新界面。
不論是寫作,還是編碼,都可以開啟全新的合作方式。
canvas基於GPT-4o構建,目前仍在測試階段,可在所有模型中手動選擇。
而且所有Plus使用者不用等待,直接可用。未來,OpenAI還計劃向所有免費使用者全面推出。
canvas不僅可以讓你與ChatGPT一起做研究,還能寫程式碼、信件等等,最重要的是還能幫你一起腦洞。
有趣的是,canvas還可以添加emoji。阿特曼線上發起投票,看看有多少人喜歡這個功能。
另外,canvas面板中,還多了一個快捷選單,讓協作更加輕易便捷了。
審查程式碼、修改bug、添加評論、log等等,一鍵完成。
在Canvas界面助力下,GPT-4o編碼效能飛躍18%!
這是要紛紛取代了GitHub Copilot、Cursor編碼神器了。網友們驚嘆道,OpenAI絕殺了Cursor。
還有人說,canvas的推出,是OpenAI對最大勁敵Anthorpic的Claude artifacts最大的回擊。
在經歷如此巨大人事變動同時,OpenAI近日多次釋出更新,是向外界、投資者給出了我們依舊有實力的反饋。
話不多說,看看歷經兩年,ChatGPT究竟帶了怎樣劃時代的巨變。
肝程式碼研究,原來這麽輕松
canvas計畫負責人Karina Nguyen表示,我對終極AGI界面的願景,是一張空白的畫布。
隨著時間的推移,它會根據人類偏好,自我改進。
而且,它會創造與人類互動的新方式,重新定義人類與AI,以及整個互聯網的聯系。
canvas便是,這樣一種終極AGI界面的完美「代言人」。
那麽,它究竟如何幫人類研究、寫程式碼、創作呢?
接下來,讓我們一睹為快。
做研究
當你需要完成一項藝術史研究報告,在canvas便可以完成研究。
首先,將你的需求告訴ChatGPT,它便開始搜尋一切所有相關的報道——Rembrandt的自畫像技巧。
隨之,canvas在螢幕右側開啟了全新界面,一篇研究報告,正在速成。
當你對其中生成的一句話,不太確定是否正確。只需要選中,然後即刻就能喚醒ChatGPT,隨地取問。
又或者,當你想要更改文中的小標題,不如讓ChatGPT給點建議。
最驚艷的是,右下角「鉛筆」樣子的圖表,可以開啟文獻的閱讀模式,可以一句一句地瀏覽。
最後,你可以讓ChatGPT為你添加參考文獻、書目參照。
寫信件
你還可以讓ChatGPT搜尋一家最好的餐廳,它會幫你匯總所有在SF城市米其林餐廳。
然後讓它在為你寫一封信件,發給最好的朋友。
寫程式碼
另外,你還可以在canvas界面中,完成程式碼的生成,還是可以編輯的那種。
以往ChatGPT只是給出結果,並不能一同編輯。
讓ChatGPT用Rust寫一API網路伺服器,它便同以往一般,為你生成了程式碼。
然後,要求對其中一段程式碼,添加登入註冊路由。
並且,你還可以自己覆寫其中的內容。
在界面右下角,還有一個工具列,可以進行程式碼審查、轉換語言、修改bug、添加log、還有添加評論功能。
比如,針對剛剛生成程式碼進行審查,以及修復bug,ChatGPT瞬間就完成了。
發明新食譜
更驚艷的是,在canvas模式下,還可以創造發明新的idea。
比如,你想做一個不一樣的蘋果派,可以讓ChatGPT搜尋總結出,最通用的蘋果派的食譜。
假設你沒有其中一種材料——Nutmeg(肉豆蔻),然後你們可以一同創作全新的做法。
與ChatGPT並肩作戰
目前,ChatGPT已常被用於協助寫作和編碼方面的任務。
盡管聊天界面易於使用並且適用於許多工,但對於需要編輯和修訂的計畫,仍然有些不便。
canvas的推出,正是要為這類工作提供新的界面,而且能讓ChatGPT更好地理解使用者提供的任務上下文。
當ChatGPT檢測到可能有幫助的場景時,canvas會自動開啟,也可以直接在提示詞中包含「使用canvas」的字樣來處理現有計畫。
對於寫作任務,快捷編輯列中包含5種選項,從下至上依次為:
- 建議編輯:ChatGPT為指定內容提供行內建議和反饋
- 調整長度:將文字內容編輯得更短或更長
- 更改閱讀級別:調整文字的閱讀難度,從幼稚園到研究生院
- 最後潤色:檢查語法、解析度和一致性
- 添加表情符號:為強調或有顏色標記的內容添加相關emoji符號
比如,可以高亮特定部份來引起ChatGPT的關註,並讓模型在考慮整個計畫的同時,提供行內反饋和建議。
阿特曼還發起了線上投票,「添加emoji是不是OpenAI有史以來釋出的最好功能?」
對於編碼任務,快捷鍵又和寫作不同:
快捷鍵從下至上依次為:
- 檢查程式碼:ChatGPT提供行內建議以改進程式碼
- 添加日誌(logs):插入print語句以幫助偵錯和理解程式碼
- 添加註釋:為程式碼添加註釋
- 修復bug:檢測並重寫有問題的程式碼以解決bug
- 移植到一種語言:將您的程式碼轉換為JavaScript、TypeScript、Python、Java、C++或PHP
「點到哪裏改哪裏」,修改程式碼也將和修改文字一樣直觀簡單。
為什麽要更新使用者介面?
OpenAI在部落格中表示,如果要讓人工智慧變得更有用、更易用,就需要重新思考我們如何與它互動。而canvas,就是一種全新的方法,未來還將經歷快速叠代。
終極AGI界面canvas,GPT-4o也被最佳化了
為了讓模型更適應canvas模式,團隊也對GPT-4o進行了必要的修法,添加了一些核心行為:
- 觸發canvas的開啟,進行書寫和編碼
- 生成多樣化的內容型別
- 進行有針對性的編輯
- 重寫文件
- 提供行內形式的修改意見
值得一提的是,對GPT-4o進行的這些訓練采用了OpenAI的合成數據生成技術,包含了從o1模型中提取的輸出。
此外,團隊還使用了20多項自動內部評估來衡量進展情況。
首先,一個關鍵的挑戰是定義何時觸發canvas。模型既需要靈敏辨識有檢查、修改需求的任務,比如「寫一篇關於咖啡豆歷史的部落格文章」,同時也要避免過度觸發,比如「幫我做一份新的晚餐食譜」這種一般的任務就不太需要canvas。
與帶有提示指令的基線模型相比,調整後的GPT-4o的觸發決策正確率分別達到了83%和94%
第二個挑戰涉及在canvas被觸發後調整模型的編輯行為,特別是決定何時進行有針對性的編輯而不是重寫整個內容。
這就要訓練模型,在使用者明確選擇文本時,更傾向於執行有針對性的編輯而非重寫。隨著模型不斷完善,這種行為的能力也在不斷發展。
相比基線模型,帶有canvas的GPT-4o在寫作和編碼任務上有18%的效能提升
最後,訓練模型以生成高品質的程式碼註釋同樣需要細致的叠代過程。
這個評估任務與前兩種情況不同。canvas是否觸發以及是否進行了有針對性的編輯行為,很容易進行自動化評估,但以自動化方式衡量程式碼註釋的品質,因此團隊選擇了人工評估。
相比基線模型,整合canvas後的GPT-4o在註釋準確性方面有30%的提升,品質提高了16%。
這表明,與帶有詳細指令的零樣本提示相比,合成數據的訓練顯著提高了模型的響應品質和行為。
網友玩瘋了
canvas一經釋出,已在全網掀起熱議。
Every初創公司創始人表示,很明顯,OpenAI不僅僅是在構建聊天機器人,他們還試圖為AI時代構建一種全新的操作系。
一名開發者表示,canvas界面是遊戲改變者。
他剛剛透過canvas和ThreeJS一起建立了一個tesseract/Hypercube視覺化工具,並稱自己喜歡統一的UX聊天、線上評論和觀看GPT-4o在程式碼上發揮其魔力,所有這些都在一個地方完成完成,永不過時。
還有網友表示,canvas界面做的非常好,而且一切都是即時流暢的。
不過,它讓我們意識到一個重要的問題,我們還不確定與AI協作寫作的最佳方式是什麽。
話雖如此,canvas讓工作更加整合整合(cyborglike),而不是簡單地輪流進行任務(centaurlike)。
還有人紛紛悼念Cursor。
核心貢獻團隊
canvas背後核心團隊也隨之全部公布。
研究主管是Karina Nguyen,還有3位核心研究人員Kai Chen, Michael Wu, Tarun Gogineni,12位元核心工程/產品/設計師。
值得一提的是,提供支持技術領導人當中,還有離職的CTO Mira Murati。
Karina Nguyen
在加入OpenAI之前,Karina Nguyen曾在Anthropic任職,專註研究模型對齊能力和誠實研究,以減少LLM的幻覺。
值得一提的是,她曾領到了Claude Instant 1.2訓練,在API中制作了該模型。
此前,作為一名設計工程師,Nguyen與Primer.ai、Dropbox、Square和【紐約時報】的團隊在研發原型、新聞工具和產品功能方面進行了合作。
Kai Chen
Kai Chen在賓夕法尼亞大學獲得了電腦科學本科學士學位。
她於2023年初加入OpenAI,此前Kai Chen還聯合創辦了兩家公司,一個是AI助手領域的Dispatch、還有一家自動化勞動任務計畫的Port Tecjnologies。
Michael Wu
Michael Wu目前是OpenAI的套用研究員。
此前,他曾以套用研究科學家身份,在Facebook工作了三年,任職期間訓練了自然語言理解和深度學習模型。
此外,他還在Primer AI擔任機器學習工程師、Dropbox擔任軟體工程師,在Naver Corp擔任機器學習實習生,在蘋果公司擔任機器學習實習生。
2015年,Michael Wu在麻省理工學院獲得了電腦科學和數學學士學位。