最近,Sora引爆了整個AI圈,由它創造出的影片在各大平台刷屏,很多人看完以後驚呼不像是演的。
我們來看下這段影片的提示詞(Prompt):
一位時尚的女士穿著黑色皮夾克、長紅裙和黑色靴子,手拿黑色手袋,在東京一條燈光溫暖、霓虹燈閃爍、帶有動感城市標誌的街道上自信而隨意地行走。她戴著太陽鏡,塗著紅色口紅。街道潮濕而有反光效果,色彩繽紛的燈光仿佛在地面上創造了鏡面效果。許多行人在街上來往。
在模型和數據的「導演」下,一段文字就這樣幻化成一分鐘細節拉滿,畫面精致的影像。
根據OpenAI的說明,在技術上Sora使用了Transformer架構,有很強的擴充套件性。Sora將Token的理念進一步創新,提出了「Patch」概念,將影片和影像表示為patch,為模型在理解和處理更豐富、更復雜資訊創造有利的工具。
同時,Open AI 還放出了一個爆炸性訊息,Sora能理解和模擬運動中的物理規律,訓練出與現實世界互動的模型。傳統的影片生成模型,只是機械性地對著樣本學習,根據畫面的像素特征進行復制、延伸和填補,從而疊加成影片,這種模式下生成的畫面會缺乏創造力,同時有時也會產生畫面變形等問題。Sora則是嘗試著理解畫面中物理世界的互動關系,並從中學習知識從而產生新的視覺畫面。
形象地說,現在有一段蘋果砸到牛頓頭上的影像,傳統的AI模型從中學習到的是蘋果、人和大樹的像素分布特征,然後根據這些特征去仿作類似的畫面。然而Sora則從中領悟到萬有重力的物理定律,那麽在它所創造的影像中,出現的物體運動就都要符合萬有重力的邏輯。
盡管有一些業內人士,對OpenAI所宣稱的Sora能理解「物理規律」表示質疑。但這個一分鐘的影片所展現的效果,無疑是人工智能的一大步了。
第一批打工人已經開始用上AI機器人
最近幾年,人工智能的步伐似乎突然提速,類似Sora的這些震撼性突破接連發生。也許人們很快就不再對人工智能表現出驚奇了,因為它將無處不在。對我們而言,若不想被時代的列車甩開,當務之急是要盡快把AI用起來。
2023年,百融雲創已經在內部開放了一款AI工具——賽博坦平台,部份員工已經率先將其套用在日常工作中了。透過賽博坦系統,每位員工可以建立專屬機器人(可以是一個也可以是多個),機器人能勝任文件處理、文本生成、程式碼生成、知識問答、搜尋知識庫等工作,它就像一個不知疲倦的助手,幫助人們高效完成工作。
員工還能將各類資料「投餵」給機器人,機器人完成消化、吸收後,將全面掌握這些知識。員工可以利用機器人做些要點提煉,或者生成新的知識等工作。
值得一提的是,雖說是專屬機器人,但它並非是封閉的,一方面它能連線外部的各類知識庫和套用系統;另一方面,人們還能將自己的機器人分享給其他同事,這名同事將能自由調配這個機器人裏所有的知識和能力。
賽博坦就像一個大型試驗現場,讓我們提前感受到作為生產工具的AI能帶來哪些意想不到的變革。
從公司內部員工使用的反饋來看,當AI做為生產工具時,它最大的價值也許並非是工作效率的提升,而是AI會幫助人們變得更加全能,會讓人們快速掌握自己前所未有的技能。
比如一名研發工程師,不以文案工作見長,但在AI機器人幫助下也能寫出抑揚頓挫、文采飛揚的技術文件。可能他不懂畫畫,但是透過AI機器人,也能把腦子裏的想法變成一張圖片。可能他也不懂影片,但是透過AI機器人,也能將想象力變成精美的影像呈現出來。當然,AI未必能讓他的影像水平達到斯皮爾伯格的水平,但可以達到一個可用的門檻。俗話說技多不壓身,多個技能的綜合套用也勢必拓展自己的視野和能力邊界,試想一下,一個能寫會畫的程式設計師,那將是多麽強大。
當然,新技術不是立刻見效的,人們需要時間來了解如何高效地使用它。
AI也是如此,即便是同一個機器人,我們發現它所展現出的能力是不一樣的,機器人的能力與使用者的知識深度、專業技能,以及提示詞套用能力息息相關。
我們相信,終有一天AI會像辦公軟件一樣成為每個人日常的工具,至於它能為人們的職業發展、社會進步帶來什麽,還需要時間給出答案。現在可以肯定的是,就像影片裏的那個自信的女士一樣,人工智能也正自信地向我們走來。