谷歌又整新活了！AI生成圖片太逼真，網友：這誰頂得住啊

2024-10-11科技

谷歌又雙叒叕放大招了！

前幾天，谷歌AI團隊放出了 新一代影像生成模型Imagen 3 ，直接把圖片生成能力拉滿 …

在谷歌的官網上輸入文字，就能生成對應的圖片。

「我畫了一只小貓。」

「我想要一張日落的圖片。」

「我想看一只大象在草原上奔跑。」

「我希望能有一個家庭在海灘度假。」

這些場景都是用谷歌新出的Imagen 3生成出來的圖片

相比之前的版本，新版本在細節上處理得更加到位， 甚至已經能生成高分辨率的人臉影像了。

除了人臉之外，其他類別的影像也生成得非常逼真。

小IN試了一下，要求它生成一個拿著話筒唱歌的女歌手，結果生成的影像連歌譜上的符號都一清二楚

。

這個版本的Imagen還增加了一項新功能： 可以對生成的影像進行微調。

只需要提供一張範例圖片，系統就能根據這張圖片的風格來調整生成圖片的樣式。

比如小IN想要一張夜晚星空的圖片，但是範例圖片是白天拍的，就可以先提供一張白天的圖片給AI。

然後AI就會生成一張既符合描述，又和範例圖片風格一致的圖片。

除此之外，谷歌這次還開放了 Imagen 3的API介面。

以後全球各地的開發者、設計師都可以在自己的網頁或者APP上呼叫谷歌的這項功能， 只要輸入相應的文字描述，就能得到免費的精美圖片。

谷歌表示，他們希望借此讓全世界的Gemini（雙子星）使用者體驗到更加強大的圖片生成能力。

「無論你是藝術家、設計師、學生還是普通愛好者，只要你有想法，就能透過谷歌Imagen 3得到滿意的答案。」

谷歌官方還放出了一段演示視訊，展示Imagen 3生成的各種圖片

從效果來看，這些圖片的品質已經非常驚人了。

既有抽象的藝術創作，也有具體的實物攝影——

還有各種自然景觀、城市模組屋、人物肖像……

甚至還有電影截圖裏的名場面。

谷歌官方表示，他們的目標是讓谷歌Imagen 3成為圖片生成領域的「終極版」。

目前，谷歌已經將訓練好的模型參數上傳到了網上，任何人都可以直接下載使用。

雖然谷歌沒有限制每天的呼叫次數，但畢竟是免費的，所以難免會有人濫用。

有網友就擔心，這會不會造成影像版權的問題？

畢竟有些照片是受版權保護的，如果未經允許就隨意使用，可能會面臨賠償風險。

對此，谷歌方面表示會采取一些措施來解決這些問題，但目前還沒有給出具體的方案。

除了版權問題之外，還有一個比較現實的問題就是： 生成的圖片品質越高，所需要的算力也就越大。

目前，訓練一個Imagen模型需要花費數周時間，而且需要配備價值10萬美元以上的GPU。

不過，谷歌承諾未來會降低呼叫Imagen 3的費用，並且提升其生成圖片的品質。

雖然谷歌的技術遙遙領先，但不得不說，現在市面上也有一些其他的AI公司也在做類似的計畫。

比如Stable Diffusion，也是一家非常優秀的AI企業。

早在2021年，Stable Diffusion就成功訓練出了能夠以假亂真的圖片生成模型。

而谷歌直到今年才推出自己的影像生成模型，比Stable Diffusion足足晚了兩年。

這次谷歌突然放大招，估計Stable Diffusion心裏也有點慌：老大哥這是要搞事情啊！

不管怎麽說，谷歌的這一舉動對整個AI行業來說都是一件好事。

隨著技術的進步，人工智慧將會在越來越多的領域大放異彩。

或許在不久的將來，我們就能見證人工智慧真正達到「無所不能」的那一天。