當前位置: 華文世界 > 數碼

vivo:做成一部AI手機,究竟要自我推翻多少次?

2024-10-13數碼

AI手機,vivo趟路。

封面來源| 企業提供

盡管三年蟬聯國產手機市場份額TOP1,但依舊無法抹除vivo身上的「不合群」感。

比如,當所有人都覺得手機是不再是一門性感的生意,而調轉槍口做起產業生態、磨刀霍霍向造車時,vivo依舊堅守手機的一畝三分地:從影像最佳化到作業系統,從AI能力升級反向倒推芯片的設計。

直到今年10月,vivo突然又講起了AI大模型,以及作業系統與AI手機的「新故事」。

如何定義AI手機?

這個故事沒有宏大敘事,表面上看,是傳統企業對新技術的又一次擁抱與探索;本質內核,則是一個領跑者,當前路已經沒有「參考答案」之時,自我顛覆的最佳剖析樣本。

早在,2017年vivo就在內部組建了專門的AI研究團隊;基於大模型技術推出的「藍心小V」與vivo自研的通用大模型矩陣「藍心大模型」也早在2023年推出,但手機上裝載AI助手,相簿增加個智能去路人的特效,就是AI手機的全部想象力了嗎?

如此定義,未免太投機取巧。

為了思考這個問題,vivo一度經歷了漫長的陣痛期。

由vivo副總裁周圍親內建隊,在去年,vivo花了整整11個月時間去思考,AI手機到底是一個怎樣的事物。

困難來的猝不及防。無往不利的「使用者導向」調研,在關於「AI手機」上這個新事物上收效甚微:當你在200年前,問一個人,怎麽讓車跑的更快,他只會告訴你,選一匹更貴的馬……相似的劇情,在大模型時代再次重演。

前方沒有路,就自己蹚出一條路。靜默期的後6個月,vivo決定,「從頭造一輛所有人都沒見過的汽車」。

10月10日的vivo開發者大會上,vivo正式官宣全新AI戰略——藍心智能,將大模型技術與手機作業系統深度融合後的個人智能。vivo將大模型技術與手機作業系統深度融合,為使用者持續構建更自然、符合直覺的互動,帶來更智能溫暖的體驗。

但這種AI+作業系統,與過去的智能相簿,智能備忘錄有什麽區別?vivo將這種深度融合,拆解為三步走:

第一步,從底層開始重塑,向互動動刀。

在vivo內部,每次新品推出之前,必定 有一次關於行業邏輯的復盤與推演。周圍曾向團隊安排這樣一個思考題:為什麽輕觸式熒幕能夠取代傳統的鍵盤式諾基亞?

一個最基礎的邏輯就是:輕觸式熒幕的互動邏輯相比於各種按鈕一定是更加方便的;左滑右滑是比按鍵盤要更加靈活,可能性也更多的。在此之後,觸屏手機從用指甲蓋去操作發展到用指尖去操作,本質變化也是讓整個的操作和互動更符合人的自然習慣和的直覺。

思考到這一步,問題就可以被進一步延伸,什麽比觸摸還要高效?毫無疑問是語音,這個看似已經被講爛了的技術,一旦融合進作業系統,在產品上的體驗上,將會帶來巨大的突破和變革。

但語音不同於全球統一標準的手勢觸控,不同國家、不同地區都有著不同的語言:為此,vivo的聲音大模型將粵語,四川話,東北話,河南話甚至苗族話全都進行了專門的語言互譯適配,力求人機對話,更自然、更情感化。

互動的鏈路被縮短之後,vivo的第二把火燒向了人與數碼世界的服務體驗:AI手機需要掌握從被動變主動的能力。 更通俗來說,手機作為最了解使用者的「數碼陪伴」,不該只會被動應答。

這種被動變主動,可以從三個方向進行拆解:第一點,依托 AI 技術對手機的基礎功能進行全面升級,重構輸入法、電話、筆記、掃描等 15 項剛需功能,構建了平台化的 AI 公共能力;第二點,搭建連線服務的框架和平台,包括為開發者搭建的集合開發和分發於一體的智能體平台,以及針對輕量化和原子化的服務構建的完整的意圖框架體系,讓人找服務的同時,服務也主動匹配人的需求。第三點,構建個人智能系統框架,讓手機成為專屬個人助理。

比如,「小V建議」可以以桌面常駐元件的形式,24小時提供主動貼心服務。在使用者外地出差時,無論出門時的打車建議、到機場後的登機口提醒、抵達後的城市攻略,還是抵達酒店前的入住提醒,小V都能提前預知並給出最合適的建議。

再比如「小V記憶」,不僅了解使用者的想法,也一直默默地記憶著與使用者相處的點點滴滴。而對於使用者日常收藏的各種各類文章、影片,小V也會認真地進行整理。在部份旗艦機型上,小V會利用端側的分析能力,將收藏內容以更有邏輯性的方式進行呈現。

更進一步,手機連線起的只能是數碼世界嗎?vivo的思考是否定的,手機應當能借助大模型重構人與物理世界的連線。

比如「vivo看見藍心升級版」,聽見透過搭配無線耳機以及適配網絡攝影機,可以幫助盲人,告訴他們洗發水在哪裏,護發素在哪裏,沐浴露在哪裏,如何上車?甚至告訴他們去到一個博物館中正在展覽的東西是什麽。進而視障人士更好地看見、聽見眼前的世界,去探索世界的美好。

技術的屠龍刀與套用的老戰場

當確定了vivo要做什麽,能做什麽之後,接下來的故事就進入了雙線敘事劇情,鍛造技術的屠龍刀與尋找套用的戰場。

技術上,2024 vivo開發者大會期間,vivo對AI能力做出了四大重點釋出:

重點一,【升級語言大模型】:vivo正式推出千億級藍心大模型雲端能力,重點最佳化意圖理解與分發、任務規劃能力。相比去年,整體能力提升30%,並在CMMLU和SuperCLUE的榜單上繼續領跑國內第一梯隊。

重點二,【釋出藍心端側大模型3B】:針對「模型小 能力強 功耗低「的行業不可能三角困局,vivo推出全新30億參數的藍心端側大模型3B,在對話寫作、摘要總結、資訊抽取等能力上可以越級比肩行業7B-9B模型。相比藍心7B極致效能提升300%,平衡模式下功耗最佳化達46%,記憶體減小63%,極致出詞速度可以達到80字/s,系統功耗僅450mA ,記憶體僅占用1.4GB。

重點三,【釋出藍心語音大模型】:當前,vivo自研的藍心語音大模型已經可以做到準確理解自然語意,感知情緒,模擬人聲,而且支持中英日韓泰同聲傳譯,以及超過15種語言互譯。

重點四,【釋出藍心影像大模型和藍心多模態大模型】:vivo將藍心影像大模型針對中國特色與東方美學做了升級;藍心多模態大模型,則在今年升級了上下文理解和記憶能力,能夠對手機螢幕更深度的理解,在影片流的即時對話上也更加流暢自然。

技術的屠龍刀在手,vivo應該將其用在何處?

相比重新定義手機,vivo更願意將其稱為對已有功能的最佳化:至少,多年的產品經驗告訴vivo,現在的手機關於如何打電話,發短訊,圖片編輯,小算盤,或許我們已經足夠適應與熟悉,但距離完美還有很長的路要走。

這是一場老戰場上的新戰役,而接下來的工作重點就是去梳理那些我們習以為常,但仍有巨大進步空間的市場究竟在哪裏。

周圍回憶每年他都會特地留出三個月時間進行閉關,「我們有130多個賽道,對應130多個技術小組的總監高級總監。和他們,我每個星期5天要花4天半的時間開會,就是在回答通訊你準備怎麽做,通訊你的使命是什麽?你準備完成哪幾個你的目標,你的123是什麽?每個賽道全部都這麽過了一遍。」

已有功能最佳化的典型成果代表是搜尋。最新上線的智能體小V圈搜,不僅支持透過長按導覽列的形式將它呼出,使用者還可以直接將圖片、檔、文字直接以向下拖拽進行處理。除了支持已有的語音和文字指令輸入之外,使用者還可以用最自然的指尖圈選的方式,把想要了解的內容發送給小V,透過小V搜尋快速找到想要的本地文件或是服務,點選預覽列表就可以直接開啟。

系統層面的最佳化代表,則是OriginOS 5的記憶體最佳化機制更新。隨著微信、王者榮耀為代表的軟件記憶體占比逐漸龐大,記憶體不夠用、卡頓,成為了很多使用者困擾的頭件大事,過去,行業的通用做法是在硬件上做加法,在此基礎上,vivo在軟件層面,在安卓領域內首創Ledger記憶體賬本機制,並叠代升級了不公平排程機制3.0和虛擬顯卡2.0,透過在儲存、計算效率及顯示體驗等方面的整體最佳化,實作「多載如輕載,長久使用亦流暢」,更能輕松應對大型手遊等多載場景,帶來感官和操作上的極致流暢體驗。

思考好了做最佳化的減法,接下來的問題就是怎麽做減法,以及誰來做減法。

用工程化思路去做大模型

做減法的過程中,vivo一度將自己比作一個龐大專案中的包工頭。而包工頭最重要的工作就是溝通與打樣。

打樣的重點是智能體。比如最常用的智能家居連線中心,過去透過手機控制智能家居往往步驟繁瑣,且經常會出現型號不適配的情況。為解決這一問題,vivo訓練了一個學會4000多種空調操作的智能體,如此一來,相比過去,同樣是智能家居控制,但是新的智能體,對於空調適配以及控制的泛化性都有了極大提升。

以此為樣板,vivo接下來的任務就是做大生態,挨個談合作。 vivo的思路是,跳出各大套用都在做基於自身APP的智能體的思維限制,vivo從手機端建立起一個更泛化的智能體廣場。

這中間vivo的主要精力應該放在介面標準,耦合以及使用者使用範式的建設,說的更直白一些,就是手機作業系統層面,完成初步的使用者意圖辨識後,透過中台去匹配智能體廣場中的不同智能體套用,將他們的能力與使用者的需求進行連結, 從而解決使用者問題,幫助套用獲客。

過程中,vivo向後退一步,如果一個套用行業裏已經有50個團隊在完成這件事情,那麽vivo就堅決不去做:比如使用者有音樂需求的時候,那麽喚起的智能體不是vivo的智能體,而是 QQ音樂等音樂平台來進行最專業的內容回答。

基於這種使用者問題牽引,生態夥伴向前,vivo定位後退的導向:目前階段vivo已經學會了上百萬個套用的操作。

而當量變引發質變,一個神奇的現象發生了,下載一個全新套用之後,人工智能比人類更早學會了APP的各種隱藏功能與玩法。

距離喬布斯高喊重新定義手機,已經過去了十幾年。這十幾年間,全球的手機產業,都在按照喬布斯最初的軟件生態為王,觸摸互動簡化的設想一路滾滾向前。過程中,所有的手機企業,有競爭,但更多的是沿著同一方向進步的心照不宣。

直到此時此刻,大模型再次重新定義手機。

過去手機只能觸摸互動,小算盤必須是個獨立功能、相簿只是簡單的分類照片……這樣的幾乎形成肌肉記憶的刻板經驗,在一夕之間全部被推翻。

vivo們的重新定義物件變成了自己,以及過去的軍功章。

這註定是一場漫長而艱辛的道路,而本分,是通往未來唯一的門票。