編輯:桃子
【新智元導讀】時隔5個月,Imagen 3終於可以人人可用了,而且還能支持是生成人物影像。與此同時,谷歌宣布了Gemini AI的重大升級,全新AI客製助手Gems已經面向150多個國家推出。
Gemini AI平台又雙叒升級了。
這次,谷歌直接給配上了Gems助手,還有最新影像生成模型Imagen 3!
這當中,最讓人興奮的便是,Imagen 3可以人人用上了。
網友們早已急不可耐,紛紛上手開啟了測試。
Imagen 3支持人物生成了
5月的I/O開發者大會上,谷歌首次對外亮相了Imagen 3影像生成的能力。
此後幾個月時間,這個AI生圖工具一直在測試中。
正如當時博文所述,Imagen 3可以根據文本提示,建立出更高品質的影像。
另外,Imagen 3設定了影像品質的新標準,只需幾個單詞就能生成影像。
你甚至可以要求Gemini 創作各種風格的影像,比如照片上的寫實風景畫、紋理油畫,或者是異想天開的泥土場景。
值得註意的是,谷歌再次引入了生成人類影像的照片。此前,因AI生圖人物帶上了有色眼鏡,谷歌便被全網攻擊。
為了解決人們對深度造假、錯誤資訊的擔憂,谷歌已采取了安全措施,比如浮水印SynthID。
升級後的模型,外媒Ars測試後發現,當讓AI生成拜登打籃球的影像時,會被拒絕請求。
而當你請求「美國總統打籃球」,便可以得到更多的請求選擇。
另外,在一些快速測試中,Imagen 3還避免了生成「歷史上不準確」的種族陷阱。
比如,讓它生成一副英國國王肖像,AI會生成穿著一襲紅色長袍,留著胡須的白人,而不是以往種族多元化戰士的組合。
如下是生成教皇的照片,可以看出整體非常穩定。
以往的生圖效果是下面這樣的,左右性別不一致,而且樣貌多樣。
現在,當你再讓Imagen 3去描繪歷史場景,便會違反谷歌的人工智慧的規則。
然而,谷歌Gemini此前毫不避諱地生成出了,穿著納粹風格衣服的亞洲人、黑人。
有人測試後,感覺Imagen 3整體效果不錯,不過仍有很長的路要走。
客製AI助手Gems
專門化的人工智慧助手Gems支持Gemini Advanced,企業、以及商業使用者,面向150多個國家。
現在,任何一個人可以透過Gems,為特定任務訓練一個「數位專家」。
它可以是編碼導師,也可以是行銷策略師等等。
谷歌希望,這類面向定特任務的AI助手,能夠解決像GPT-4o這樣通用語言模型的局限性。
因為透過專門數據訓練/客製的專業助手,能夠提供更加實用、更高效的解決方案。
AI巨頭激戰正酣,谷歌毫不示弱
過去一年裏,包括OpenAI、微軟、Meta、Anthropic、HuggingFace等在內的公司,都推出了可客製的AI聊天機器人平台。
這標誌著整個行業,向個人化AI體驗轉變。
OpenAI的GPT Store於1月推出之後,開發者們可以建立和分享ChatGPT的客製版本。
微軟的Copilot Studio,可以讓企業能夠開發客製的AI助手,而Meta的AI Studio是為了建立客製聊天機器人。
Anthropic展示了Claude自動化任務的能力,HuggingFace為客製GPT提供了一個開源的解決方案。
此時,Gems和Imagen 3的釋出,似乎是谷歌試圖追趕,甚至趕超競爭對手的一次嘗試。
一直以來,谷歌是AI研究領域的先驅,但在面向消費者的AI產品推向市場方面,有時會落後於對手。
特別是,在別家早已釋出自訂助手之後,谷歌才有所行動。
從科幻到現實:AI重塑世界
話又說回來,不論是誰家釋出,這一新功能可能會對整個行業,產生深遠的影響。
在教育領域,AI導師可能會提供個人化學習體驗;在醫療保健中,專門的AI助手能診斷和治療規劃。
在企業中,可以使用客製AI工具簡化營運。
另一方面,AI的進步也引發了關於數據私密、工作替代、潛在濫用的問題。
盡管谷歌采取了一些強有力的安保措施,但AI發展的步伐已經超過了監管框架。
隨著AI繼續深入日常生活,谷歌Gemini AI可能會激發出這項技術的變革潛力。
參考資料:
https://venturebeat.com/ai/googles-gemini-ai-gets-major-upgrade-with-gems-assistants-and-imagen-3/
https://arstechnica.com/ai/2024/08/months-after-controversy-google-ai-can-generate-images-of-humans-again/
https://blog.google/products/gemini/google-gemini-update-august-2024/