當前位置: 華文世界 > 科技

在最聰明的時代做最笨的事

2024-05-12科技

- 專訪知玄合夥人張迪

從偶然讀到【J Magazine】開始,我就註意到了知玄。當很多行銷公司還在用直播帶貨、網紅引流和元宇宙概念撬動客戶時,他們卻在寫劇本、出書和做雜誌,顯得有些「不務正業」。再次在媒體上看到知玄,是他們剛剛推出了一款基於人工智能大語言模型的創作系統 – F.E.E.D,她還有個好聽的中文名 - 「未語」。把業務方向釘選在樸素的文字,在近年來市場不斷收縮的情況下,公司依然保持了穩定增長。出於對獨角獸企業和人工智能領域的敏感,也帶著對他們商業模式的好奇,我走進了知玄位於北京總部的辦公室,想聽聽公司合夥創始人張迪的答案。

張迪,筆名Eddie. 非985、211外貿專業,文科生。早年在路透、GettyImages從事市場推廣、商務合作,後進入傳播和行銷行業,迄今已有20年。我們的對話是從他案頭那本史丹福大學歷史系教授墨磊寧寫的【中文打字機:一個世紀的漢字突圍史】開始的。

筆者:真巧,這本書我也剛剛讀完。想不到在過去的100多年,中外知識分子曾經對漢字的廢存和改革有過那麽激烈的爭論,連魯迅那樣靠寫字謀生的作家當年也說過「漢字不滅,中國必亡」這麽極端的話……

張迪:是的,據說中國是在美國、前蘇聯和英國以後,第四個研究機器轉譯的國家,這其實說明我們一直對中文有緊迫感。幾乎每次有新技術,都會引發大家對中文的思考。書裏提到當年中文打字機遇到的困難,今天到了大語言模型訓練和研發階段也還存在。在人工智能爆發的時代,中文語言在套用層面的發展仍然面臨著很多問題。這也是我們決定在一群開發大模型的拓荒者背後,選擇做一個「拾荒者」的原因。

筆者:問題究竟出在哪兒?能否說的具體一點?為什麽要做一個語言垂類模型套用?

張迪:從技術角度上講,每項前沿技術出現都是英語表現最好。因為這些技術在英語環境下誕生並實驗。英文輸入簡單,漢字還要克服語言學和工程技術的難題。ChatGPT這類語言大模型主要被「投餵」的就是英文。網上公開的漢語魚龍混雜,廣告行銷內容居多,需要花費大量精力辨別。

國內公司的大模型和英文模型相比除了算力,還有一個瓶頸就是高質素中文語料的稀缺。有關機構做過這方面統計,中文開源數據集的數量只有英文開源的10%左右。大模型技術屬於機器學習的範疇,要從數據中找規律,對語料的需求量是天文數碼。但互聯網上合法合規、能用來訓練的內容和數據其實並不多,充斥著大量重復、空洞單調、偏重行銷的廣告語,一些高質素內容更是需要妥善考量和系統規劃。我比較認同商湯科技張行程說過的一句話:低質素的語料會把大模型帶偏除開內容,在國際背景下長大的模型,由於中文的特殊性和復雜性,也還需要做很多本地化工作。所以我們覺得,是時候該做點什麽了。

筆者:你如何理解人工智能,你覺得這些技術會為企業傳播帶來哪些改變?

張迪:人工智能一定是當下商業變革的主力。大模型已經從學術層面成為法律咨詢、客戶溝通和金融服務的工具。全球最大上市咨詢公司埃森哲有個預測,生成式人工智能可能影響各行業大概40%左右的工作時長,能提高近千種不同類別的工作效率。

個人覺得碎片、流量、媒體、數據加上後疫情,企業面臨的機遇和風險和過去完全不一樣了。一家企業在以前幾十年裏形成的直覺幾乎失效了,所以都面臨著新的戰略選擇。現在國內有很多公司讓團隊用AI改文件、提創意,分析對手,撰寫商務信函、潤色宣傳海報和釋出社交媒體……大家都在探索利用這些工具,想取得先發優勢。反過來,如果一家公司太依賴大語言模型生成的內容,忽視創新和審查,也會造成內容同質化,同時品牌個性和吸重力也會降低。所以模型需要不斷最佳化去適應不同的傳播場景,還要確保內容的安全和準確。

反過來說,雖然大家會被人工智能這個概念所吸引,但並不是所有的新概念都會有清晰的意義和方向。因此任何公司的領導層在面對新技術時,首先需要的是清醒的頭腦,保持一個開放的心態。

易中天說未來無法預測,現狀不可描述,一切皆有可能,我覺得用這句話概括當下的人工智能套用再合適不過了。

筆者:你們是一家咨詢類公司,怎麽想到做垂直行業的技術類套用呢?

張迪: 2020年的疫情是我們業務的轉折點。那時客戶的需求體量和預算都在大幅縮減,人們的日常生活也受到了不同程度的影響。我想文字內容傳播既然是企業的「剛需」,寫作又是很多人的技能愛好,不受時間、地點限制,完全可以作為業務抓手。這種以內容為主的方向,也讓我們在過去幾年中見證了很多行業的興衰和品牌的起伏。我覺得做內容的最大好處,就是能始終感受到當下這個時代的脈搏,和市場同頻共振。

2022年11月,ChatGPT大語言模型出來了,我們意識到這將是對內容創作的一次顛覆。這一次人工智能不僅能輸出數據,同時也能讓每次傳播的內容成為下次的素材,從而使創作形成良性迴圈。透過AI加持,內容終於可以回歸創作本身,不再受個人風格、理解能力、認知天花板等「場外因素」影響。

我們幸運地遇到了人工智能飛速發展的時代。既然語言模型可以最大限度提升內容創作效率,那就應該緊緊抓住這個機會。後疫情時代,市場環境和大眾心理都發生了巨大變化。我覺得無論公司還是個人都應該「換種活法」,而換活法的前提就是找對方法和方向,我覺得我們已經找到了。

筆者:人工智能模型畢竟屬於技術範疇,你這個文科生是如何理解AI大語言模型的呢?

張迪:有句話叫「大象無形」,大模型技術打通了很多東西。可能因為早年從事和新聞、傳播有關的工作,所以對這個領域比較敏感。雖然是文科生,但我覺得真正能把語言模型價值發揮到極致的恰恰是文科。

企業使用人工智能解決實際業務問題的前提,是要讓AI常年學習,把它當做持續的對話夥伴,反復改進。需要盡可能多地輸入和具體問題相關的數據。比如你的思維方式、過往得失、產業政策、行業基準等大量內容。這就需要很多從事過相關工作的「專才」。沒有行業經驗和小步叠代的系統方法,想為企業培養和訓練傳播模型,就像家長給自己的孩子找了個不合格的家庭教師。

況且人工智能有時反饋的資訊並不嚴謹,精準的內容需要經過訓練更高質素的套用並不斷強化才能逐步得到。現階段,與語言類模型展開多輪對話,學會提問才是解決之道。當數據越來越豐富的時候,管理這些「似是而非」和不準確的內容會變得特別重要。

人和大模型是典型的遇強則強,遇弱則弱,需要反復「挑戰」AI,而這也正是我們業務存在的最大價值。我覺得如果理科生是大語言模型的發明者,那麽文科生就是這個套用的布道者。

筆者:既然利用語言是種技巧,只要是技巧就有規律和捷徑,AI訓練的時候能不能找到捷徑?

張迪:這是一個特別有代表性的問題。很多人和模型對話以後都想提煉一個通用「樣版」,想在以後的對話能直接套用得到高質素的答案。這種想法其實忽視了現階段語言類模型的限制,更忽視了特定領域所需要的專業。對話內容的復雜性、上下文聯系的重要性和交流人員的專業程度都需要考慮在內。我們經過實踐發現,這種適用於特定情境、能產生優質呼應的樣版根本不存在。

語言模型這種對話形式本身存在一定局限,所以即使反復調整提示語、對模型進行微調,也不一定能達到預期效果。大多數時候人們並不知道自己想要什麽,需求也往往很模糊,這就更需要專業人員的參與。

那些所謂的提示技巧雖然有一定價值,但遠不能替代專業知識的學習和實踐。只有理解問題本身才能正確表述,從而得到想要的答案。此外除了理解專業,對自身需求的認知,所處環境的理解,對需求變化的捕捉,都比提示詞重要得多。

筆者:你們如何看待大語言模型被用於垂直內容輸出呢?

張迪: AI技術帶來的變革,給品牌帶來了緊迫感。誰的積累越早、技術越適應,誰就越能更快地傳播意識形態並從中受益。未來是得數據者得天下。

ChatGPT、Gemini這樣的人工智能屬於通用系統,雖然可以解決不同問題,但只有精準垂類模型才是地基上的建築,是學校、醫院、銀行這些具有服務內容的真正意義上的套用。只有經過專業訓練的垂類模型才更有價值,更能滿足個人化的需求、適應更多場景。

大模型像一個正在學習的少年,它的「學問」、「能力」和訓練語料質素有很大關系,都需要廣博與精深。大模型技術類似於一種人工智能基礎設施,它的通識能力很強。但在使用時還要用少而精的數據調教,即行業內常說的「對齊」。

我認為本質上,內容行業的資源分配方式沒有因為大語言模型的出現而改變,蛋糕還是那麽大。但現在我們正在讓人工智能的目標、價值觀和傳播方趨於一致,力求讓系統每次的學習都能更有意義,讓客戶的每次傳播都不再受到幹擾。

團隊每天思考和踐行的,就是向模型提供高質素、正面的數據。我們要確保產出的內容既符合品牌調性,遵守法律法規,同時還要降低潛在風險和負面影響。隨著人工智能技術的進步,我覺得大語言模型的垂類套用將在企業傳播、品牌建設和公共關系管理中扮演更重要的角色。

筆者:說說你們的F.E.E.D吧,我覺得這個名字還挺形象,她到底是什麽?究竟能解決什麽具體問題?

我:這個名字既體現了人工智能大語言模型不斷叠代、自我前進演化的特點,同時每個獨立的字母也有對應的涵義。F、E、E、D分別代表了流程 (Flow)、執行 (Executing)、學習 (Education) 和規律(Discipline)這也正是這個系統包含的重要理念和步驟。

先說流程。假設你是一家企業市場部的負責人,要給大領導準備用在行業峰會上的發言。只要登入F.E.E.D提出要求,系統就會總結歸納你的想法,然後為創作者生成「創作指引」。這種形式可以幫作者更好地理解需求。在創作過程中,作者還能隨時呼叫F.E.E.D裏關於品牌、產品、權威媒體報道等和完稿有關的資訊。這些資訊經由知玄編輯團隊提前篩選、錄入並分類,不但能保證素材的精準,還能很大程度提升作者資訊檢索的效率。在內容完成後,編輯會把這些經過你確認的「成品「再進行分揀歸納,經過提煉總結後加入F.E.E.D,成為下次內容創作素材,形成良性迴圈。系統下一次會把你此前對內容的批註和修改進行系統記錄,不會再犯同樣的錯誤。同時你也不用擔心人員離職、領導更替這些「場外因素」,因為每次創作的內容都會沿著原有品牌傳播路徑,不會受到幹擾。

接下來說執行。而由誰來執行,作為執行者的作者就成了重要一環,他們往往決定了一篇稿件質素的平均水平。只有經歷過溝通、試稿、糾錯、學習和反饋的全部過程並合格,創作者才有資格進入知玄的F.E.E.D系統,成為我們的合作者。而作者即便具備了服務資格,也要經過系統的匹配和篩選,再根據其過往經驗、從業背景、擅長領域和創作風格分配任務,從而最大限度保證每次創作的質素。不僅如此,F.E.E.D還能根據客戶每次對作品的反饋意見對作者進行綜合評估。系統這樣做的目的是盡可能做到精準匹配,減少溝通成本。這些反饋也會同步被我們的編輯團隊捕捉,用於AI系統學習,作為下次創作的重要提示。

再說說Education這個環節。除了人員、內容素材和完整的AI訓練,還有一部份權威媒體資訊摘要也很重要。今天獲得資訊已經不是一件難事,難的是在嘈雜的環境下找到具有真正意義和價值的內容。我們的編輯團隊把很多國內外專業媒體報道的內容和客戶傳播結合,提煉核心摘要和重要觀點,生成供創作者具備更高視野、掌握宏觀資訊、快速學習行業與重要素材引述的基礎。你可以想象一下,當作者把這些內容套用於自身創作,對質素的影響是不是不言而喻?與此同時,所有內容也會按照各個維度系統分類,成為一個個獨立的「品牌百科」。你要是再進入系統,可以很方便檢索到既往所有你公司的品牌歷史、產品叠代和關鍵資訊,讓你們傳播的內容更精準。

說了那麽多,其實上面所有的步驟和工具都是在為滿足創作規律服務。沒有系統學習和積累,想短時間生成一篇達到傳播預期的內容,成功的概率相當於每次買彩票都能中大獎。只有符合「創作規律」才能產出合格的內容。這中間工具、流程、數據、經驗、團隊缺一不可,少任何一個環節都會差之千裏。企業以傳播為目的的內容和個人寫作不同,後者是「獨角戲」,是對自己負責;而前者更像是「集體創作」,受到領導風格、品牌調性、產品特點和執行人員對需求的理解等各種因素影響。在AI尚未普及的「史前時期」,內容依賴的是個人、經驗和素材;有了大語言模型,專才、流程和系統就成了這個時代下創作的新三駕馬車。F.E.E.D恰恰就是為了順應時代而誕生的那個「馬車夫」。最後再補充一點,F.E.E.D的中文叫「未語「,我們取這個名字,既想體現」未雨綢繆「,也想表達」餵哺語言「,因為這既是未來傳播基石,也是品牌傳播趨勢。

你可以把她理解成一個內容創作的「生態」系統,這上面有客戶、有服務、作者、專業編輯,創作內容素材,也有基於語言模型AI互動的學習流程。

說白了,只要企業對外發聲就需要內容,所有內容的底層都是文字,而文字質素會受創作者能力、創作方法、工具、素材質素以及內容稽核等綜合因素的影響。F.E.E.D這個平台充分利用了人工智能的特性,把所有影響創作的因素都考慮在內,以保證每次內容的質素都能達到一定水準並不斷提升。

這些每次創作並得到傳播的內容,還能作為下次創作的素材訓練AI。人創作了內容,內容幫助系統前進演化,前進演化後的系統反過來會幫助人更好地完成下次創作,形成一個良性迴圈。我不知道自己能不能說清楚,也歡迎你來親自體驗一下,這種人機互動,相互踩著肩膀完成創作的感覺。

筆者:聽了這麽多,我覺得F.E.E.D其實就是「AI加人工」,這種模式很多公司也在做,你們最大的不同或是核心價值體現在哪裏呢?

張迪:AI加人工是當下很多公司都在探索的方式,大家面臨的問題也都差不多,那就是如何去理解並駕馭人工智能、匹配什麽樣的專才、催生什麽樣的市場需求,推出的套用是否是企業剛需,未來究竟有多大的市場前景……

這幅圖來自【哈佛商業評論】一篇叫 「The Best Leaders Can’t Be Replaced by AI」(AI無法取代最優秀的領導者)的文章,我在作者的基礎上加入了一個模組。個人覺得這部份恰恰是最應該基於語言類模型產生的套用,而這也正是F.E.E.D存在的最大意義和價值。

F.E.E.D的不同主要有幾點,一是我們的OML(Optical Machine Learning)即最佳化機器學習手段。這種方式是基於對咨詢和傳播行業的深刻理解,是豐富經驗的總結、歸納與實際套用;二是我們的公司基因,那種「不務正業」讓團隊培養了回歸創作規律的工作習慣,近400名遍及全國的創作者也進一步延展了我們的創作範疇;三是迎合產業賽道和風口的一系列做法,比如更多服務新能源汽車等朝陽產業、為很多新質生產力與獨角獸企業提供了完善的品牌。最後也是最重要的,同樣是AI加人工的業務模式,為什麽知玄可以被註意到,很大一部份因素取決於這條賽道是否已經被市場驗證,被客戶認可並能創造出更多價值。我們現在每天做的事情就是把已經被客戶「買單」的內容,再次讓機器學習,這種學習不是簡單的照單全收,而是根據行業內容、品牌特征和產品情況,被分門別類安放,只有用這種「笨’辦法,才會讓系統越來越智能。

我最後想說的是,人工智能、AIGC、大語言模型……這是一個聰明絕頂的時代,但聰明只是表象,聰明的背後是不變的底層邏輯,只有播種、施肥、除蟲才能長出果實。知玄就在做這些看起來「笨笨「的事情,但這些事總要有人去做。當然這裏有個前提,那就是這件事一定要有價值。

後 記

這次采訪的資訊量有點大,這也是我從業以來寫得最長的一篇專訪。因為出身新聞專業,提問一直都是我最核心的工作方式。好問題像杠桿,能撬動思想通往無數可能。這和今天我的采訪物件在做的事情有某種程度上的「不謀而合」。「知道正確的問題比擁有答案難得多」。學會更聰明地提問,將可能成為在今天這個AI掌權的世界裏,新的個人生存法則。張迪和他的團隊同樣也是一群會提問的人,但他們不只會提問,他們還會把這些答案「反哺「給回答問題的人,讓下次的回答更嚴謹,也更令人驚喜。

從理解語言到寫程式碼,AI的能力幾乎在所有方面都超過了人類的基準線。世界已經悄然從「答案舉足輕重」變成了「問題至關重要」。在今天這個人工智能被普遍套用的當下,它們有時候是我們的同事,有時又成了競爭對手,有時是員工,有時甚至還是老板……但無論它們是什麽,AI都會持續把自己嵌入一切,最終無處不在。

在結束完采訪的那一刻我突然意識到,新技術賦予了人們一種新的權力,誰越早下場、誰獲勝的機率就會越大。我理解了張迪最後總結的那句話:在一個聰明的時代,總要有人要去做一些笨的事情…..權力運作的方式正在慢慢改變,這一次我們終於有機會能以不一樣的方式行事了。