當前位置: 華文世界 > 科技

大模型重塑版訊飛輸入法來了!能懂每個人的AI輸入

2024-10-28科技

作者 | 程茜
編輯 | 漠影

智東西10月28日報道,訊飛輸入法又上新,這次是端側大模型重塑版!

科大訊飛的大模型底座上周官宣更新,訊飛星火4.0 Turbo七大核心能力全面超過GPT-4 Turbo,數學和程式碼能力超越GPT-4o,國內外中英文14項主流測試集中拿下9項第一。

在此之上,搭載著訊飛星火端側輸入大模型、訊飛星火語音大模型的訊飛輸入法14.0亮相,再次讓人眼前一亮。

訊飛輸入法14.0的」AI輸入增強「可以直接讓輸入法「猜你喜歡」,輸入上句就能秒出下句,聊天氣、遊玩計劃都不在話下;在大模型的加持下,輸入法方言語音輸入即將支持多達202種;為了更契合生成式AI輸入,輸入法的界面升級活力視界2.0,除了各種功能卡片、切換動效一應俱全,個性皮膚設定也讓視覺煥新;還有橫貫娛樂、生活、工作等各大場景的AI助手。

這一被大模型重塑的訊飛輸入法14.0,提出的「每個人的AI輸入」價值主張,已經清晰呈現在大眾視野中,讓所有人都能享受AI輸入服務的可能成為了現實。

可以看到,大模型套用時代,這一歷經40多年發展原先只用於打字的輸入法,已經在作為使用者日常工作、生活、娛樂必備互動工具這件事上更勝一籌。

在大模型走向落地套用深水區的同時,現在大大小小的AI原生套用層出不窮,但像輸入法這樣與使用者日常生活連線如此緊密,又能在不同界面隨時呼叫AI能力的產品並不多。

但如果輸入法直接與大模型簡單粗暴的相接,只能解決助力表達的一環,但新的問題又接踵而至。首先雲端大模型輸入服務成本高,其次使用者對生成內容的多樣化需求難以被緊湊的鍵盤界面滿足,還有通用模型難以解決使用者垂域溝通場景的體驗,這些都是當前AI為名的輸入法亟需解決的難題。

那麽,在AI席卷我們日常生活的當下,訊飛輸入法針對於上述痛點的思考是什麽?輸入法如何潛移默化影響我們的日常表達?看完訊飛輸入法14.0的全面重構,我們或特許以找到答案。

一、輸入法也能「猜你喜歡」,輸入中前後三大場景幫你秒回訊息

現在不論是聽音樂、購物、點外賣…………「AI輸入增強」經常能猜中我的內心想法。你有沒有想過在聊天中,也能有一位24小時隨時待命「猜你喜歡」的互聯網嘴替?

這就是訊飛輸入法14.0重磅更新的本地AI化的「聯想」和「預測」功能。不過,這可並非此前輸入法中預埋的根據上文猜詞功能。在訊飛星火端側輸入大模型的加持下,我有時候只需要一句話,輸入法上就會自動生成下文的完整回答。

先來聊一下最近大家都關心的天氣。

當我向聊天物件發出「今天好冷啊」,訊飛輸入法上方的輸入框就能自動幫我接上下一句,「多穿點衣服」、「不要著涼了」,不僅省下了輸入的時間,還能給我一些聊天靈感。

聊天氣、聊周末安排時,這些直接出現的短句都深得我心。

除了直接給出關聯句子,這一輸入法還能根據使用者的關鍵詞進行「私人訂制」回復。

當我打出「我想周末去公園」,輸入法就可以自動幫你聯想到去公園需要天氣好的時候,所以當打出「天氣」,輸入法就會自動補齊句子。

晚上極度疲憊想要和朋友快速結束對話,當你打出「我要早點睡」,訊飛輸入法上方就直接出現「明天要上班」的表達,這時候你就可以心安理得拋下手機進入夢鄉。

還有一種場景是,在下雨天手拿雨傘的你本來打字就不方便,當你和聊天物件輸入「今天下雨了」,下半句話只要輸入「jide」的拼音,就可以直接生成「記得帶傘」的回復。

在增強聯想的場景中,只要你給出一個情境,訊飛輸入法就能幫你補齊下文。

例如想和朋友討論周末出去玩的計劃,當你輸入「我想去公園散步」,輸入「享受」,訊飛輸入法就可以秒懂你的想法,直接給出「享受大自然,放松心情」,消除AI機械化、硬生生的聯想。

訊飛輸入法的升級,能根據使用者輸入的拼音或者開頭關鍵詞,然後結合其日常輸入習慣聯想甚至預測出一些完整的句子。

除了打字輸入,現在語音輸入的使用場景也越來越多。基於端側大模型的泛化能力,離線狀態下訊飛輸入法的辨識能力也直線up,辨識準確率基本持平雲端語音輸入效果。

訊飛輸入法業務部總經理程坤補充道,這一離線語音辨識的功能可以讓使用者網絡不好時,也能實作完整輸入體驗。為了做到這一點,他們用大模型將離線語音功能重寫,他認為,這也是未來針對使用者做個人化輸入的基礎,能結合使用者的本地輸入習慣。這意味著,離線的語音輸入不僅僅是線上語音輸入的補充,而是有可能成為使用者使用日常語音輸入的風向標。

無獨有偶,谷歌、蘋果、OpenAI等國際巨頭科技公司正不遺余力強化語音辨識能力,提高其辨識的準確率和響應速度。

而在中文語音辨識這件事上,訊飛輸入法不斷加碼。自2010年釋出以來,訊飛輸入法已經叠代了14年。此次,訊飛輸入法14.0接入訊飛星火語音大模型,將使得方言辨識種類倍增,可覆蓋近300座城市。據悉,訊飛輸入法將在「方言免切換」中支持202種方言自由說,讓每個人都能「想說就說」。這與科大訊飛在1024開發者節上釋出的星火大模型的底座能力一脈相承。

在方言免切換的功能中,即使兩個聊天物件一個說方言一個說普通話,或者兩個人說不同的方言,也無需手動切換。當我播放了一段北京話和中原官話夾雜的方言音訊,訊飛輸入法也準確辨識了出來。

二、上萬個AI人設,幫你分分鐘化身網絡顯眼包

當然大模型賦能的輸入法能力遠不止於此,更新後的訊飛輸入法還能讓AI直接橫跨你的工作、生活、娛樂社交圈。

與上司溝通、戀愛、鬥圖、轉譯、校對……形形色色的場景都能讓你在輸入法中找到對應的AI助手。

對於我而言,社交場景中最頭疼的就是工作相關的溝通環節,既需要準確傳達自己的意思,還要把握好和同事、客戶溝通的方式。

所以訊飛輸入法的AI助手中,我高頻使用的就是「高情商溝通」助手。

當與同事合作完成一個專案,但專案DDL就在明天,僵硬的催促可能不是溝通的好辦法。這時候你只需要點選高情商溝通,選擇溝通物件以及想要的風格,訊飛輸入法就直接生成了5種回復方式,語氣詞、關鍵資訊應有盡有。

還有更為考驗情商的一個場景就是,你需要通知大家今晚加班,這時候你只需要將「今天晚上需要加班」這幾個字打出來,AI助手就能對應生成風趣幽默、高情商、簡單直接等話術,你直接點選發送,無需再頭痛斟酌每一個字詞。

當下的網絡上的年輕人都喜歡立人設,「人設立得好」等相關話題也頗有熱度!

訊飛輸入法直接將這些人設一股腦搬到了輸入法的AI助手裏,不僅有霸道總裁、黛玉文學、大胖橘,還有烏薩奇等,想要立什麽樣的人設,AI都能幫你用「同款」風格進行聊天。程坤透露,短短一個多月時間,訊飛輸入法中官方加使用者建立的人設已經達到1萬多個。

作為甄嬛傳深度愛好者,我主要試用了「嬛言嬛語」,即使面對現代色彩濃厚的「我好困,想喝咖啡」,AI助手也非常忠於人設,直接穿越到了古代。

此外,除了面向C端消費者提供豐富的AI助手,針對於企業,訊飛輸入法也提供了領域客製化的AI助手,能根據企業所屬的行業、具體的需求,讓輸入更能深入其中,幫助企業員工提質增效。如今,訊飛輸入法已經與友邦保險聯合客製了AI行銷助手,提供了一整套智能化的解決方案。

把大模型裝進輸入法的最新形態已經被展現在我們的日常生活中。值得一提的是,訊飛輸入法的AI能力並不局限與當前,其創新采用了全新的AI外掛程式化引擎構架,使得輸入法可以靈活拓展多種AI模型,能實作廣泛覆蓋、智能融合,讓本地化的AI輸入呈現給更多的使用者。

三、讓輸入更準確、更高效、更懂使用者,大模型+輸入的更優解

訊飛輸入法正在全方位重塑中文輸入法。這除了體現在上述提到的功能升級,訊飛輸入法還在輸入界面以及使用者的互動上進行了自我革新。

為了讓生成式AI與使用者的輸入更加契合,訊飛輸入法的活力視界2.0再一次亮眼的表現。程坤談道,活力視界2.0為輸入法中的每種服務都單獨設計了卡片,並跟其本身的功能進行了深度結合。

同時,使用者在選擇不同功能時中間有動效切換並完成了和所有輸入法皮膚的適配。

程坤認為,輸入法界面的重新設計,是未來輸入法提供輸入文字之外更廣泛能力必須要走的一步。

在這個趨勢下,訊飛輸入法一直走在行業前面,正如其此前率先將傳統輸入法的候選欄變為工具列,從只有備選文字變為擁有語音輸入等更多切換按鈕。

基於這種模式,訊飛輸入法整合了很多服務,覆蓋了使用者輸入前、中、後三大場景。

輸入法作為使用者使用電子器材時呼叫頻率最高的,也是與使用者距離最近的服務,相比於其他AI產品而言與使用者的互動也更為密切、深入。

不過,這背後程坤提到,他們遇到的難題就是,大模型訓練、推理成本高,在高頻輸入場景為使用者提供大模型能力,對於輸入法本身而言並不是提供AI服務最好的路徑,因此要找到一個平衡點,讓所有使用者都能用上大模型同時成本降下來。

在輸入法領域已經積累14年之久的科大訊飛,交出了自己的答卷。

從2010年釋出業內首個中文語音輸入法,到方言語音輸入、多方言多語種免切換輸入,訊飛輸入法不斷突破高效輸入、降低輸入門檻這兩件事的極限,在生成式AI輸入法上同樣如此。

▲訊飛輸入法業務部總經理程坤

基於星火大模型,他們結合訊飛輸入法的輸入場景訓練出了端側大模型,這個大模型解決了輸入過程、輸入上屏以及輸入完成之後,下一句話如何聯想的過程。

在大模型參數不再追求龐大的參數,手機效能提升同時垂直領域大模型套用興起的背景下,端側大模型部署成為可能,這使得輸入法與端側大模型的結合多了更多可能性和創新空間。

多年布局之下,訊飛輸入法已經貫穿不同器材、不同輸入場景、不同使用者群體的個人化需求,再輔以大模型時代的生成式AI技術,將這一產品打造的更準確、更高效、更懂使用者。

結語:14年技術積累,致力於打造每個人的AI輸入

輸入法與大模型的結合與其他產品不同,既需要符合使用者傳統的使用習慣,還要將新的AI能力融入其中。輸入法是使用者日常使用頻率極高的工具,人們在長期使用過程中形成特定的操作習慣和預期,同時,大模型具有強大的語言理解、生成和預測等能力,將這些融入輸入法需要精心設計,不能簡單地堆砌功能。而恰好,科大訊飛在技術研發和產品落地的耕耘已久。

在訊飛星火大模型底座之上,訊飛輸入法搭載了訊飛星火端側輸入大模型,全力支撐輸入法的拼音和離線語音輸入,同時基於訊飛星火語音大模型雲端能力的快速叠代用於提升方言輸入種類和效果,將通用大模型與垂域小模型的能力充分體現到使用者的輸入過程之中,真正實作AI的互動體驗升級。

訊飛輸入法發展至今已經14年時間,且星火大模型自去年起就成績頗豐。可以看到,訊飛輸入法已經在端側大模型時代努力打造普惠的屬於「每個人的AI輸入」。