鞭牛士報道,10月27日訊息,據The Information報道,谷歌最早可能在 12 月預覽其對 Rabbit 大型動作模型概念的看法。
據該媒體采訪的三位直接了解該專案的人士稱,該專案的代號為Project Jarvis,將為使用者執行任務,包括收集研究、購買產品或預訂航班。
據悉,Jarvis搭載了谷歌 Gemini 的未來版本,只能與網絡瀏覽器配合使用(它專門針對 Chrome 進行了調整)。
據The Information報道,該工具旨在透過截取和解釋螢幕截圖,然後點選按鈕或輸入文本,幫助人們自動執行日常的基於網絡的任務。
在目前的狀態下,操作之間似乎需要幾秒鐘。
最大的人工智能公司都在研究能夠完成The Information所描述的任務的模型。微軟的 Copilot Vision可讓您與它談論您正在瀏覽的網頁。預計 Apple Intelligence 將在明年某個時候了解您螢幕上的內容,並在多個應用程式中為您執行操作。
Anthropic 推出了一款繁瑣且容易出錯的 Claude 測試版更新,它可以為您使用電腦,而 OpenAI 據稱也在開發該版本。
The Information提醒稱,谷歌 12 月展示 Jarvis 的計劃可能會發生變化。據報道,該公司正考慮向少數測試人員釋出該功能,以尋找並幫助公司解決漏洞。