當前位置: 華文世界 > 科技

Stability AI 推出新一代文生圖模型 Stable Cascade

2024-02-15科技

IT之家 2 月 15 日訊息,據 Stability AI 官方新聞稿,Stability AI 日前推出了一款名為「Stable Cascade」的新一代文生圖模型,該模型建立在 Würstchen 架構上,號稱可以在消費級硬件上進行簡單的訓練和微調。

▲ 圖源 Stability AI 官方新聞稿(下同)

官方聲稱,相對於業界熟悉的 SDXL,全新的 Stable Cascade 模型在效能及聲稱內容質素上均有所提升,目前 Stable Cascade 模型的相關數據已經在 GitHub 頁面上公開,但僅允許非商業用途使用。

IT之家註意到,在使用者輸入文段後,相關內容會被 Stable Cascade 模型轉換為 24x24 體積的小型數據集合,此後模型將解碼這些小型影像數據生成圖片,並繼續將圖片放大為高分辨率影像,由於系列步驟之間彼此分離,因此可以對模型各方面進行各種額外訓練及微調。

Stability AI 表示,由於 Stable Cascade 模型采用如此「模組化」設計,因此能夠有效降低推理使用的視訊記憶體,號稱只需要 20 GB 視訊記憶體即可執行。

Stability AI 同時將 Stable Cascade 模型與 Playground v2、SDXL、SDXL Turbo、Würstchen v2 等業界文生圖競品進行比較,號稱無論是提示詞對齊(Prompt Alignment)還是在生成的圖片細節上,Stable Cascade「幾乎都是表現最佳的模型」。而在推理速度方面,即便 Stable Cascade 最大的模型比 Stable Diffusion XL 多出 14 億參數,仍然具有更快的推理速度。

據此,官方認為 Stable Cascade 在架構設計方面較佳,可以在保持高質素輸出的同時維持高效的推理速度。

模型生成內容圖賞: