當前位置: 華文世界 > 科技

Stability AI推出新一代文生圖模型Stable Cascade

2024-02-16科技

IT之家 2 月 15 日訊息,據 Stability AI 官方新聞稿,Stability AI 日前推出了一款名為「Stable Cascade」的新一代文生圖模型,該模型建立在 Würstchen 架構上,號稱可以在消費級硬件上進行簡單的訓練和微調。

▲ 圖源 Stability AI 官方新聞稿(下同)

官方聲稱,相對於業界熟悉的 SDXL,全新的 Stable Cascade 模型在效能及聲稱內容質素上均有所提升 ,目前 Stable Cascade 模型的相關數據已經在 GitHub 頁面上公開,但僅允許非商業用途使用。

IT之家註意到,在使用者輸入文段後,相關內容會被 Stable Cascade 模型轉換為 24x24 體積的小型數據集合,此後模型將解碼這些小型影像數據生成圖片,並繼續將圖片放大為高分辨率影像,由於系列步驟之間彼此分離,因此可以對模型各方面進行各種額外訓練及微調。

Stability AI 表示,由於 Stable Cascade 模型采用如此「模組化」設計,因此能夠有效降低推理使用的視訊記憶體,號稱只需要 20 GB 視訊記憶體即可執行 。

Stability AI 同時將 Stable Cascade 模型與 Playground v2、SDXL、SDXL Turbo、Würstchen v2 等業界文生圖競品進行比較,號稱無論是提示詞對齊(Prompt Alignment)還是在生成的圖片細節上,Stable Cascade「幾乎都是表現最佳的模型」。而在推理速度方面,即便 Stable Cascade 最大的模型比 Stable Diffusion XL 多出 14 億參數,仍然具有更快的推理速度。

據此,官方認為 Stable Cascade 在架構設計方面較佳,可以在保持高質素輸出的同時維持高效的推理速度。

模型生成內容圖賞: