當前位置: 華文世界 > 科技

設計師+AI,3個月就能完成一套千字中文字庫@智琮科技

2024-07-20科技
視點 發自 凹非寺 量子位|公眾號 QbitAI
插播一條熱知識!
系統內建的微軟雅黑 字型,千萬別直接拿來商用!(別問我怎麽知道的,淚了)
但是,正版字型商用授權=不菲的授權費……
咱就是說,在這一塊,也可以用AI來降本嗎?
浙大系創業公司智琮科技 告訴咱:可以。
他們從2019年開始就用AI制作字庫,推出了朱雀仿宋等字型。
在智琮科技看來,對於字數眾多、字形復雜的漢字,AI還大有可為。不僅能代替繁重勞動,也能創造隨機的美感。
量子位「365行AI落地方案」 邀請到了智琮科技CTO殷葉航 ,一起聊了聊用AI生成漢字字庫的難點與解決方案。
一套漢字字庫6千字起步
制作漢字字庫,難就難在:第一字多,第二字形結構復雜。
別看漢字結構看似只有橫豎、撇勾的幾種筆畫,當你把相同部首的字疊加在一起時,會發現甚至沒有任何兩個提土旁是完全重合的。
這就是為什麽,我們需要借助AI來解決漢字字庫問題。
從2017年開始,zi2zi專案讓AI造字成為了字型設計行業實踐中的一部份 ,甚至可以用AI生成根本不存在的字。
但AI生成的字仍然存在規模套用的問題。
首先,AI造字是基於位圖實作的,但是字庫的字是基於貝茲曲線的向量圖。所以生成的字噪點多、模糊不清,很不準確。
其次字形設計與技術生成的過程是相分離的。通常是由設計師設計幾十上百字,然後交給技術團隊來生成,設計師很難介入生成的結果。
這讓AI生成的字形在很長時間裏,只能作為字型設計的參考。
轉機發生在2022年,擴散模型的推出。
首款AI設計的字型集——朱雀仿宋
在2022年8月Stable Diffusion釋出後,智琮科技就開始嘗試生成簡單的字形變化:例如將鳥的形象與漢字結合起來。
在嘗試中團隊發現,擴散模型生成的影像質素非常高。於是就有了第一個開源的字型產品——朱雀仿宋 。
目前這款字型在GitHub上有2.6k stars,在2023年8月25日登上了GitHub熱榜。
AI參與字型設計最直觀的改變,是時間的壓縮 。按照估算,原本需要按年計算才能做完的字庫,現在只需1-3個月。
其次,是工作量的壓縮 。
以朱雀仿宋為例,純設計師手工設計的僅有85個漢字字形,近5000字是純AI生成的,還有將近1000個字形是設計師與AI共同設計的。
圖生圖的生成方式,也給了設計師很大的便利,可以透過互動形式來叠代字形。而且可以從漢字結構的層次,去思考字的形態。
設計師與模型共創的過程也很有趣。殷葉航形容「模型就像是一個野獸」,這是與AI鬥智鬥勇的過程。
比如在生成「𰻞」(biang二聲)這個字時,先把字寫在紙上,再讓模型修正字型的風格,接著反復叠代人工修補和模型修正的過程,最後生成了漂亮又符合風格的字形。
最近,智琮科技還和錨塢合作推出了最新的字型設計「光錐宋」,覆蓋了27000余中文字形。
AI創造的美:創意與錯誤的邊界
當AI參與創造性工作,不可避免的需要平衡精準度與隨機性的關系。
我們會發現「酬」這一豎,實際上並不連續:一開始非常細,而後變成中等粗細,最下方又變成比較粗。 其實這是設計師人為創造的筆畫不連續,利用視錯覺讓字形看起來更和諧。 在擴散模型中,也會生成這樣不精準不連續的效果。但卻有非常有意思的、不統一的美感,就像人寫字時候突然有個字特別滿意。
當將人工智能套用於創意行業時,創意和錯誤的邊界在哪裏?
殷葉航表示,在沒有錯字的底線之上,智琮科技也樂意保留同樣一個字的不同字形,讓字型在排版中呈現書法一般的變化。
英文字型只有26個字母,一套字型庫最快幾周時間就能制作出來。
但中文字型庫由於字形眾多,因而需要大量人力堆疊,沒有團隊合作很難制作。這也是為什麽中日韓的字庫公司較少,往往以一兩家為主。
而現在有了AI,漢字單字的造型成本有希望大幅降低,不再需要繁重的重復勞動。
字型設計師不用再擔心新的想法需要推翻一整套設計的成本,平面設計師有更廣泛的風格選擇,字型庫市場有更豐富、物美價廉的選擇。
我們最終的目的是,把人從這種繁重的勞動中解放出來,真正做到創意、審美至上。
也許過不了多長時間,在AI的幫助下:只需要一個設計師,也能制作一套中文字庫。
關於365行AI落地方案
AI技術的落地套用不僅限於科技領域,它已經滲透到各行各業,成為推動產業升級的重要力量。因此,「365行AI落地方案」主題策劃應運而生,我們尋找各行各業中成功套用AI技術的案例和方案,分享給更多的產業內人士。