谷歌又雙叒叕放大招了!
前幾天,谷歌AI團隊放出了 新一代影像生成模型Imagen 3 ,直接把圖片生成能力拉滿 …
在谷歌的官網上輸入文字,就能生成對應的圖片。
「我畫了 一只 小貓。」
「我想要一張日落的圖片。」
「我想看一只大象在草原上奔跑。」
「我希望能有一個家庭在海灘度假。」
這些場景都是用谷歌新出的Imagen 3生成出來的圖片
相比之前的版本,新版本在細節上處理得更加到位, 甚至已經能生成高分辨率的人臉影像了。
除了人臉之外,其他類別的影像也生成得非常逼真。
小IN試了一下,要求它生成一個拿著話筒唱歌的女歌手,結果生成的影像連歌譜上的符號都一清二楚
。
這個版本的Imagen還增加了一項新功能: 可以對生成的影像進行微調。
只需要提供一張範例圖片,系統就能根據這張圖片的風格來調整生成圖片的樣式。
比如小IN想要一張夜晚星空的圖片,但是範例圖片是白天拍的,就可以先提供一張白天的圖片給AI。
然後AI就會生成一張既符合描述,又和範例圖片風格一致的圖片。
除此之外,谷歌這次還開放了 Imagen 3的API介面。
以後全球各地的開發者、設計師都可以在自己的網頁或者APP上呼叫谷歌的這項功能, 只要輸入相應的文字描述,就能得到免費的精美圖片。
谷歌表示,他們希望借此讓全世界的Gemini(雙子星)使用者體驗到更加強大的圖片生成能力。
「無論你是藝術家、設計師、學生還是普通愛好者,只要你有想法,就能透過谷歌Imagen 3得到滿意的答案。」
谷歌官方還放出了一段演示視訊,展示Imagen 3生成的各種圖片
從效果來看,這些圖片的品質已經非常驚人了。
既有抽象的藝術創作,也有具體的實物攝影——
還有各種自然景觀、城市模組屋、人物肖像……
甚至還有電影截圖裏的名場面。
谷歌官方表示,他們的目標是讓谷歌Imagen 3成為圖片生成領域的「終極版」。
目前,谷歌已經將訓練好的模型參數上傳到了網上,任何人都可以直接下載使用。
雖然谷歌沒有限制每天的呼叫次數,但畢竟是免費的,所以難免會有人濫用。
有網友就擔心,這會不會造成影像版權的問題?
畢竟有些照片是受版權保護的,如果未經允許就隨意使用,可能會面臨賠償風險。
對此,谷歌方面表示會采取一些措施來解決這些問題,但目前還沒有給出具體的方案。
除了版權問題之外,還有一個比較現實的問題 就是 : 生成的圖片品質越高,所需要的算力也就越大。
目前,訓練一個Imagen模型需要花費數周時間,而且需要配備價值10萬美元以上的GPU。
不過,谷歌承諾未來會降低呼叫Imagen 3的費用,並且提升其生成圖片的品質。
雖然谷歌的技術遙遙領先,但不得不說,現在市面上也有一些其他的AI公司也在做類似的計畫。
比如Stable Diffusion,也是一家非常優秀的AI企業。
早在2021年,Stable Diffusion就成功訓練出了能夠以假亂真的圖片生成模型。
而谷歌直到今年才推出自己的影像生成模型,比Stable Diffusion足足晚了兩年。
這次谷歌突然放大招,估計Stable Diffusion心裏也有點慌:老大哥這是要搞事情啊!
不管怎麽說, 谷歌的 這一舉動對整個AI行業來說都是一件好事。
隨著技術的進步,人工智慧將會在越來越多的領域大放異彩。
或許在不久的將來,我們就能見證人工智慧真正達到「無所不能」的那一天。