當前位置: 華文世界 > 科技

體驗剪映新AI:圖片生成滿分,影片生成拉跨

2024-05-10科技

說起剪映,相信大部份人對它的第一印象都是影片剪輯,憑借操作簡單、使用方便等特點,剪映深受影片小白、剪輯愛好者,乃至影片工作者喜愛。

今年年初,Sora文生影片給行業帶來了不小的震撼,作為一款時刻處於潮流尖端的軟件,剪映自然不會錯過AI浪潮,將產品與生成式AI相融合,或許是影片剪輯軟件的未來方向之一。

近日,剪映Dreamina官宣其品牌正式更名為中文「即夢」,同時全量上線AI作圖和AI影片生成功能。即夢核心功能包括圖片生成、智能畫布、影片生成以及故事創作,其中圖片生成和影片生成功能為大家熟知的文字、圖片描述生成,借助AI技術降低使用者創作門檻;而智能畫布功能則是即夢的一大亮點,透過互動式設計,讓使用者對圖片或AI生成圖片進行二次創作。

而故事創作功能即AI生成連續性更強、更具故事性的影片,小雷對這個功能十分期待,這意味著使用者對AI影片的把控性會越來越強,假以時日,未必不能借助AI生成人物一致、內容一致的長篇連載影片。不過目前該功能還在測試中,正式上線還需等待一段時間。

最近小雷也體驗了不少AI生成產品,有驚喜,也有失望,即夢的生成式AI水平屬於什麽水平,讓小雷帶你一探究竟。

文生圖片表現穩定,產品本土化需重視

即夢首頁布局比較簡潔,重點突出AI作圖和AI影片兩大功能模組,模組下方羅列著其他使用者創作的作品,包含動漫、寫實、科幻、水墨等風格。

小雷大致看了一圈,感覺作品質素還挺高的,並且作品生成關鍵詞絕大多數為中文,僅有少部份是英文。作為國內廠商開發的軟件,即夢AI對中文的理解能力應該比國外產品更好。

圖源:即夢

圖片生成的具體步驟與市面其他AI生成產品一致,使用者透過輸入描述關鍵詞來生成AI圖片。為了讓AI更好理解關鍵詞,即夢支持匯入參考圖以及選擇生圖模型,生成出符合使用者需求的圖片。

圖片質素和尺寸方面,使用者可以決定圖片精細度(1-50範圍),數值越大生成的效果質素越好,耗時會更久。同時,即夢支持7種尺寸的圖片比例,方便使用者使用AI圖片。

圖源:即夢

小雷參考其他作品的關鍵詞,以關鍵詞「紅色長發女人肖像,黑色長裙,寫真風格,精致的審美情感,逼真的影像」生成了一張寫真風格的圖片。不知道是網絡問題還是精細度拉的太高,第一次生成就失敗了,第二次生成過程還算順利,耗時大約30s就出現了4張不同的AI圖片。

圖源:即夢

大家覺得四張AI圖片的質素怎麽樣?小雷個人挺滿意的,人像面部、身體特征清晰。在小雷這個外行人眼中,樣張質素已經和雜誌相差無幾了,唯獨歐美風模特讓人有點摸不著頭腦。小雷輸入的關鍵詞只提及了性別,但AI似乎預設了人種。

後續小雷在不改變其他關鍵詞的情況下,新增了「亞洲」定語,AI也能順利辨識。面向國內市場,即夢AI大模型或許要在優先度方面調整,才能更符合國內使用者的使用習慣。

圖源:即夢

除了人像圖片外,即夢其他風格的生成圖片也有不俗表現。從仿真人的攝影寫真,到風格迥異的手繪插畫,小雷生成了不同風格的圖片,AI表現比較穩定,基本能精準生成,但在手指細節等生成式AI通病上還是偶爾會出現瑕疵。

圖源:即夢

智能畫布:無限擴圖是個好東西

智能畫布是即夢AI的一大特色功能,支持擴圖、局部重繪、消除摳圖、高畫質放大等功能。該功能不僅可以對普通圖片進行編輯和AI重繪,還能二次創作使用者生成的AI圖片,修改區域和風格由使用者自行決定。

圖源:Pexels

小雷首先對普通圖片(地球)進行了圖生圖AI重繪,關鍵詞為「魔幻地球」。原本普通的地球圖片經過AI重繪後,變得科幻感滿滿,新增的光影和色彩效果讓圖片變得更立體。不過因為原圖布局的原因,導致地球四周環境不夠明顯,這時候就需要擴圖功能了。

圖源:即夢

經測試,小雷發現即夢AI的擴圖功能理論上是無上限的,也就是使用者可以一直擴圖下去。擴圖時使用者可以輸入本次擴圖的關鍵詞,如果關鍵詞為空,那麽AI將按照原圖的AI風格擴圖。

小雷還是得提醒下想要體驗智能畫布的朋友,雖然智能畫布的生成效果和效率確實不錯,但局部重繪功能還是存在不小的缺陷,以普通地球圖片為例,如果你手動選擇了重繪範圍,那麽很可能會獲得各種奇葩風格的地球照片,小雷就親眼見證地球變成了一鍋餃子。

小雷猜測這可能是局部重繪沒有輸入關鍵詞選項的緣故,AI會自行判斷重繪風格,並且判斷正確率不高,或許即夢後續會繼續最佳化該功能,給使用者更好的使用體驗。

圖源:即夢

AI影片:效果不及預期

接下來是即夢AI的重頭戲——AI影片生成,與AI圖片相比,AI影片興起的時間較短,並且有Sora這樣的前輩作為參考,也能更好的觀察即夢的影片生成能力。

與圖片生成一樣,影片生成也有文本生影片和圖片生影片兩種模式。小雷先體驗了文本生影片模式,關鍵詞為「一個中國古風小女孩,在長城上跑步跳躍,表情開心,笑容甜美」。值得一提的是,非會員使用者目前只能免費生成3s的影片,想增加時長就只能充值了。

影片一出來,小雷是又驚又喜。喜的是關鍵詞幾乎都辨識到了,驚的則是影片質素差的有點離譜,尤其是小女孩的表情,小雷差點以為自己點開了B站鬼畜,五官移位就不提了,這表情多少有些猙獰了。而關鍵詞「跑步跳躍」也升級成了禦空飛行,說到底還是AI沒能徹底理解關鍵詞的邏輯。

圖源:即夢

小雷發現首頁展示的精美作品,大多是采取圖片生影片模式,並且許多使用者只是直接上傳圖片沒有添加關鍵詞,但還是能實作不錯的效果。為此,小雷繼續嘗試圖片生成影片,這次我選取了剛剛AI生成的圖片作為藍圖。

用圖片生影片模式,相當於給AI框定了方向,因此影片質素沒有出現大的紕漏,但還是同樣的問題,遠處兩個人物的動作不太符合物理定律,看上去十分違和。可能是沒有太多動作的緣故,近處人物和背景的情況相對好很多。

圖源:即夢

總的來說,兩種生成模式影片的質素還不錯,大家看到的效果是經過影片轉動圖的壓縮,影片質素有一定影響。其次,文本生影片比圖片生影片的效果差太多了,人物與背景透露著不真實感。同樣的,圖片生影片也存在許多問題,人物動作以及環境可以改進的地方還有很多。

目前受限於3s時長,小雷無法窺見即夢AI影片的全貌。按照目前的體驗,小雷認為與其說是影片,倒不如說是動圖。當然,這是針對非會員,會員解鎖影片時長後能取得什麽樣的成果,還需等待其他使用者的分享。

寫在最後

體驗AI圖片生成有多驚喜,體驗AI影片生成就有多失望,這是小雷一通體驗下來的真實感受。起初,風格各異但又能保持穩定高質素的生成圖片,讓我產生了國產生成式AI崛起的感覺,但很快生成影片的各種情況又讓我打消了這個念頭。

其實這也能理解,畢竟影片生成興起的時間並不長,即夢又是剛剛推出的新產品,使用者需要給多點耐心支持國產大模型發展,畢竟最讓人感興趣的故事創作功能還沒正式上線。現階段,即夢影片生成還存在很大的改進空間,其中3s時長的限制或許是即夢在C端傳播的最大問題。

不難理解品牌需要創造盈利點,但3s充其量只是個動圖時長,如果能稍微放寬點時長限制,使用者也能更好的感受即夢AI帶來的創造力。

目前即夢圖片生成功能限時免費,影片生成功能每個影片消耗12積分,新使用者每天領取60積分,也就是支持生成5個影片,感興趣的朋友可以自行體驗。

2024年,AI大模型加速落地,汽車成為黃金場景,「下半場是智能化」成為業界共識。

4月25日,北京車展成為新能源車走向下半場的分水嶺,智能化成絕對主角、國產品牌強勢崛起、企業家「新車模」成風景線,燃油車、合資車、洋品牌、功能車徹底落寞。

車展期間,雷科技旗下「關註電動車,更懂智能化」的新媒體電車通派出豪華報道團前往北京,進行了系統的一線專業深度報道,一共輸出8條影片、8篇深度解析以及海量短內容,全網收獲百萬+閱讀,斬獲多篇微信10萬+爆款(真實流量),在行業專業媒體引發較大關註。