當前位置: 華文世界 > 科技

OpenAI canvas一夜封神!AI編碼研究神器,ChatGPT再顛覆人機互動

2024-10-06科技

編輯:桃子 喬楊

【新智元導讀】 ChatGPT橫空出世以來,首次迎來界面史詩級升級!全新canvas界面,開啟了人類與AI協作研究、編碼的新時代,更代表著終極AGI人機互動形態。

時隔兩年,ChatGPT終迎來界面全新升級!

這一次,OpenAI官宣推出canvas。它不再是簡單的對話方塊,而是能與ChatGPT「並肩作戰」的全新界面。

不論是寫作,還是編碼,都可以開啟全新的合作方式。

canvas基於GPT-4o構建,目前仍在測試階段,可在所有模型中手動選擇。

而且所有Plus使用者不用等待,直接可用。未來,OpenAI還計劃向所有免費使用者全面推出。

canvas不僅可以讓你與ChatGPT一起做研究,還能寫程式碼、信件等等,最重要的是還能幫你一起腦洞。

有趣的是,canvas還可以添加emoji。阿特曼線上發起投票,看看有多少人喜歡這個功能。

另外,canvas面板中,還多了一個快捷選單,讓協作更加輕易便捷了。

審查程式碼、修改bug、添加評論、log等等,一鍵完成。

在Canvas界面助力下,GPT-4o編碼效能飛躍18%!

這是要紛紛取代了GitHub Copilot、Cursor編碼神器了。網友們驚嘆道,OpenAI絕殺了Cursor。

還有人說,canvas的推出,是OpenAI對最大勁敵Anthorpic的Claude artifacts最大的回擊。

在經歷如此巨大人事變動同時,OpenAI近日多次釋出更新,是向外界、投資者給出了我們依舊有實力的反饋。

話不多說,看看歷經兩年,ChatGPT究竟帶了怎樣劃時代的巨變。

肝程式碼研究,原來這麽輕松

canvas計畫負責人Karina Nguyen表示,我對終極AGI界面的願景,是一張空白的畫布。

隨著時間的推移,它會根據人類偏好,自我改進。

而且,它會創造與人類互動的新方式,重新定義人類與AI,以及整個互聯網的聯系。

canvas便是,這樣一種終極AGI界面的完美「代言人」。

那麽,它究竟如何幫人類研究、寫程式碼、創作呢?

接下來,讓我們一睹為快。

做研究

當你需要完成一項藝術史研究報告,在canvas便可以完成研究。

首先,將你的需求告訴ChatGPT,它便開始搜尋一切所有相關的報道——Rembrandt的自畫像技巧。

隨之,canvas在螢幕右側開啟了全新界面,一篇研究報告,正在速成。

當你對其中生成的一句話,不太確定是否正確。只需要選中,然後即刻就能喚醒ChatGPT,隨地取問。

又或者,當你想要更改文中的小標題,不如讓ChatGPT給點建議。

最驚艷的是,右下角「鉛筆」樣子的圖表,可以開啟文獻的閱讀模式,可以一句一句地瀏覽。

最後,你可以讓ChatGPT為你添加參考文獻、書目參照。

寫信件

你還可以讓ChatGPT搜尋一家最好的餐廳,它會幫你匯總所有在SF城市米其林餐廳。

然後讓它在為你寫一封信件,發給最好的朋友。

寫程式碼

另外,你還可以在canvas界面中,完成程式碼的生成,還是可以編輯的那種。

以往ChatGPT只是給出結果,並不能一同編輯。

讓ChatGPT用Rust寫一API網路伺服器,它便同以往一般,為你生成了程式碼。

然後,要求對其中一段程式碼,添加登入註冊路由。

並且,你還可以自己覆寫其中的內容。

在界面右下角,還有一個工具列,可以進行程式碼審查、轉換語言、修改bug、添加log、還有添加評論功能。

比如,針對剛剛生成程式碼進行審查,以及修復bug,ChatGPT瞬間就完成了。

發明新食譜

更驚艷的是,在canvas模式下,還可以創造發明新的idea。

比如,你想做一個不一樣的蘋果派,可以讓ChatGPT搜尋總結出,最通用的蘋果派的食譜。

假設你沒有其中一種材料——Nutmeg(肉豆蔻),然後你們可以一同創作全新的做法。

與ChatGPT並肩作戰

目前,ChatGPT已常被用於協助寫作和編碼方面的任務。

盡管聊天界面易於使用並且適用於許多工,但對於需要編輯和修訂的計畫,仍然有些不便。

canvas的推出,正是要為這類工作提供新的界面,而且能讓ChatGPT更好地理解使用者提供的任務上下文。

當ChatGPT檢測到可能有幫助的場景時,canvas會自動開啟,也可以直接在提示詞中包含「使用canvas」的字樣來處理現有計畫。

對於寫作任務,快捷編輯列中包含5種選項,從下至上依次為:

- 建議編輯:ChatGPT為指定內容提供行內建議和反饋

- 調整長度:將文字內容編輯得更短或更長

- 更改閱讀級別:調整文字的閱讀難度,從幼稚園到研究生院

- 最後潤色:檢查語法、解析度和一致性

- 添加表情符號:為強調或有顏色標記的內容添加相關emoji符號

比如,可以高亮特定部份來引起ChatGPT的關註,並讓模型在考慮整個計畫的同時,提供行內反饋和建議。

阿特曼還發起了線上投票,「添加emoji是不是OpenAI有史以來釋出的最好功能?」

對於編碼任務,快捷鍵又和寫作不同:

快捷鍵從下至上依次為:

- 檢查程式碼:ChatGPT提供行內建議以改進程式碼

- 添加日誌(logs):插入print語句以幫助偵錯和理解程式碼

- 添加註釋:為程式碼添加註釋

- 修復bug:檢測並重寫有問題的程式碼以解決bug

- 移植到一種語言:將您的程式碼轉換為JavaScript、TypeScript、Python、Java、C++或PHP

「點到哪裏改哪裏」,修改程式碼也將和修改文字一樣直觀簡單。

為什麽要更新使用者介面?

OpenAI在部落格中表示,如果要讓人工智慧變得更有用、更易用,就需要重新思考我們如何與它互動。而canvas,就是一種全新的方法,未來還將經歷快速叠代。

終極AGI界面canvas,GPT-4o也被最佳化了

為了讓模型更適應canvas模式,團隊也對GPT-4o進行了必要的修法,添加了一些核心行為:

- 觸發canvas的開啟,進行書寫和編碼

- 生成多樣化的內容型別

- 進行有針對性的編輯

- 重寫文件

- 提供行內形式的修改意見

值得一提的是,對GPT-4o進行的這些訓練采用了OpenAI的合成數據生成技術,包含了從o1模型中提取的輸出。

此外,團隊還使用了20多項自動內部評估來衡量進展情況。

首先,一個關鍵的挑戰是定義何時觸發canvas。模型既需要靈敏辨識有檢查、修改需求的任務,比如「寫一篇關於咖啡豆歷史的部落格文章」,同時也要避免過度觸發,比如「幫我做一份新的晚餐食譜」這種一般的任務就不太需要canvas。

與帶有提示指令的基線模型相比,調整後的GPT-4o的觸發決策正確率分別達到了83%和94%

第二個挑戰涉及在canvas被觸發後調整模型的編輯行為,特別是決定何時進行有針對性的編輯而不是重寫整個內容。

這就要訓練模型,在使用者明確選擇文本時,更傾向於執行有針對性的編輯而非重寫。隨著模型不斷完善,這種行為的能力也在不斷發展。

相比基線模型,帶有canvas的GPT-4o在寫作和編碼任務上有18%的效能提升

最後,訓練模型以生成高品質的程式碼註釋同樣需要細致的叠代過程。

這個評估任務與前兩種情況不同。canvas是否觸發以及是否進行了有針對性的編輯行為,很容易進行自動化評估,但以自動化方式衡量程式碼註釋的品質,因此團隊選擇了人工評估。

相比基線模型,整合canvas後的GPT-4o在註釋準確性方面有30%的提升,品質提高了16%。

這表明,與帶有詳細指令的零樣本提示相比,合成數據的訓練顯著提高了模型的響應品質和行為。

網友玩瘋了

canvas一經釋出,已在全網掀起熱議。

Every初創公司創始人表示,很明顯,OpenAI不僅僅是在構建聊天機器人,他們還試圖為AI時代構建一種全新的操作系。

一名開發者表示,canvas界面是遊戲改變者。

他剛剛透過canvas和ThreeJS一起建立了一個tesseract/Hypercube視覺化工具,並稱自己喜歡統一的UX聊天、線上評論和觀看GPT-4o在程式碼上發揮其魔力,所有這些都在一個地方完成完成,永不過時。

還有網友表示,canvas界面做的非常好,而且一切都是即時流暢的。

不過,它讓我們意識到一個重要的問題,我們還不確定與AI協作寫作的最佳方式是什麽。

話雖如此,canvas讓工作更加整合整合(cyborglike),而不是簡單地輪流進行任務(centaurlike)。

還有人紛紛悼念Cursor。

核心貢獻團隊

canvas背後核心團隊也隨之全部公布。

研究主管是Karina Nguyen,還有3位核心研究人員Kai Chen, Michael Wu, Tarun Gogineni,12位元核心工程/產品/設計師。

值得一提的是,提供支持技術領導人當中,還有離職的CTO Mira Murati。

Karina Nguyen

在加入OpenAI之前,Karina Nguyen曾在Anthropic任職,專註研究模型對齊能力和誠實研究,以減少LLM的幻覺。

值得一提的是,她曾領到了Claude Instant 1.2訓練,在API中制作了該模型。

此前,作為一名設計工程師,Nguyen與Primer.ai、Dropbox、Square和【紐約時報】的團隊在研發原型、新聞工具和產品功能方面進行了合作。

Kai Chen

Kai Chen在賓夕法尼亞大學獲得了電腦科學本科學士學位。

她於2023年初加入OpenAI,此前Kai Chen還聯合創辦了兩家公司,一個是AI助手領域的Dispatch、還有一家自動化勞動任務計畫的Port Tecjnologies。

Michael Wu

Michael Wu目前是OpenAI的套用研究員。

此前,他曾以套用研究科學家身份,在Facebook工作了三年,任職期間訓練了自然語言理解和深度學習模型。

此外,他還在Primer AI擔任機器學習工程師、Dropbox擔任軟體工程師,在Naver Corp擔任機器學習實習生,在蘋果公司擔任機器學習實習生。

2015年,Michael Wu在麻省理工學院獲得了電腦科學和數學學士學位。