當前位置: 華文世界 > 手機

手機十年來的大更新,即將到來

2024-02-22手機

科幻小說【三體】中存在一個亂紀元的狀態,當行星在三顆太陽的重力間波動,進行不規律運動時,會發生各種無法預測的變化。

AIGC 的爆發讓矽基世界迎來亂紀元,我們似乎處於一個奇異點元年,竭力去理解這個新世界,度過一個新文明的前夜。

在剛剛過去的春節假期裏,我們就見證了 AI 行業的瘋狂前進演化。

OpenAI 推出 AI 影片生成模型 Sora ,透過簡單的提示詞就生成一分鐘影片,這可能是通向 AGI 的重要基礎。

Google 接連上線 Gemini Ultra1.0 和 Gemini Pro 1.5,實作 100 萬 token 上下文能力,多模態能力進一步提升。

輝達釋出了本地 AI 聊天機器人 Chat with RTX,最大的「AI 軍火商」也加入到 AI 套用的市場

就在除夕夜,OPPO 也舉辦一場史上最短的釋出會,宣布進入 AI 手機時代,並推播了 ColorOS AI 新春版。

在昨天的 OPPO AI 戰略會上,OPPO 首席產品官劉作虎也進一步闡述了對於 AI 手機的理解,他表示:

AI 手機將是繼功能機、智能機之後,手機行業的第三個重大的變革階段。

這和 OpenAI CEO Sam Altman 此前一個觀點形成了有趣的互文:AI 將像手機那樣改變世界。

而在 AI 改變世界之前,人們爭先想給 AI 找到一個硬件載體。 AI Pin 和 Rabbit R1 都是有趣的嘗試,不過你也會發現這些 AI 原生器材,實作的功能場景和互動效率似乎並沒超過現有的硬件。

這樣不代表 AI 硬件就是偽命題, 2024 的確會成為 AI 硬件元年,但未來幾年內最適合作為 AI 終端器材的,還是智能電話。

智能電話依然是最好的 AI 載體

OPPO 將 AI 手機的影響視為從功能機到智能電話的演變,這個分水嶺其實就是 iPhone ,都說喬布斯重新發明了手機,他到底發明了什麽?AI 手機的參考答案就在裏面。

回到 2007 年的初代 iPhone 釋出會上,喬布斯為了解釋 iPhone 與其他手機的不同,用易用性和智能化為座標系畫了一個象限圖,給智能電話下了新的定義:智能電話=更易用+高智能。

智能電話對比功能機的易用性體現在多點觸控和大屏,這兩者是相輔相成的,雙指滑動操作的互動更加高效,滑動解鎖的操作符合直覺,實體鍵盤的取消給螢幕的更大的空間,一塊大屏意味著更好的資訊輸出效果。

至於智能化,用喬布斯的原話說,「這是一個革命性突破,將真正的互聯網帶到手機上。」正是在 4G 和智能電話的撬動下,才有個過去十幾年興起的流動互聯網時代。

那麽當我們在談論 AI 硬件的時候,這樣的衡量維度失效了嗎?答案是否定的。

今天我們所處的數碼世界,其實也是 UI 的海洋。 從 PC 到 手機,每一代通用計算平台帶來的根本性的改變,其實透過改變人機互動的方式,提升世界的數據化程度和傳輸速度。

因此,如果要說 AI 硬件對比現有的產品應該帶來什麽升級,也離不開下列幾個維度:

  • 互動效率(輸入和輸出)
  • 智能程度
  • -便攜性
  • 綜合這些維度,我們就不難發現,我們未必需要重新造一個 AI 原生器材,智能電話就是當下最適合的載體。

    昨天 OPPO 對外公布 AI 戰略後,劉作虎在介紹采訪時也認為, 至少 10 年以內,手機還是 AI 硬件的最重要一環

    就拿手機的相簿來舉例,最近我用 Find X7 拍照後我經常會使用 AI 消除功能,只要滑動手指圈一圈,就能將路人或雜物消除,基本不用再進行後期。

    不用切換其他 app,手指滑動代替滑鼠的圈選,提升了我的互動效率。而基於 AI 消除的精準度,則是智能化更高的體現。

    ChatGPT 的出現讓我們看到更符合直覺的互動——自然語言。相比 GUI 所見即所得的觸控、點選,原來我們還能以一種更簡單的方式進行互動。

    這種互動邏輯可以稱之為自然使用者介面(Natural user interface, NUI),早在 2008 年微軟首席 UI 設計總監 August de los Reye 曾公開指出,GUI 未來演進的方向就是 NUI。

    高算力的大模型和自然語言的互動,正是 AI 讓智能電話在易用性和智能化兩個座標軸再次大幅提升的杠桿 。這是影像能力、螢幕材質、處理器這些方面提升到什麽程度都難以實作的。

    將大模型塞入手機也已經成為現實。比如在 Find X7 系列上,OPPO 首次實作端側套用 70 億參數的大模型,將 AndesGPT 的 Tiny 模型放進了手機之中,模型在手機執行所需的記憶體正在快速降低。

    70 億大模型正常的模型大小是 28GB,為了真正在端側部署,OPPO 用高精度 4 位元來對模型進行壓縮和輕量化,從 28GB 最終可以壓縮到 3.9GB 左右,無論是儲存還是記憶體占用都是這個量級。

    輝達高級 AI 科學家 Jim Fan 認為,我們正在進入一個新時代。移動芯片的效能不再透過 GHz 來衡量,而是透過 tokens 生成速度來衡量。

    大語言模型是新的智能電話作業系統。

    或許未來某一天,智能電話的形態會將被新一代計算平台取代,但我們這代人大多會從智能電話上開始感受 AI 對生活帶來的變化。

    一部 AI 手機應該是怎麽樣的

    2024 年,我們已經看到 OPPO 等主流手機廠商正在擁抱 AI,那麽一部 AI 手機應該是怎麽樣的?

    昨天 OPPO 和 IDC 聯合釋出的首個 AI 手機白皮書,提到了 AI 手機的四大特征:

  • 首先要能夠高效地利用計算資源,以滿足 AI 時代下生成式 AI 的計算需要;
  • 要能敏銳地感知真實世界,了解使用者與環境的復雜資訊;
  • 還需要擁有強大的自學習能力;
  • 此外,AI 手機還將具備更充沛的創作能力,為使用者提供持續的靈感與知識支持。
  • AI 手機的體驗同樣是軟硬件的結合,但邏輯和現在的智能電話有所不同。

    依托於大模型的 OS 透過內嵌智能體,將能高效地處理復雜任務,並能主動創作,提供更符合直覺的多模態互動。

    而硬件架構有了新的衡量標準:高效能的 AI 算力底座、模型庫的管理最佳化以及智慧仿生感知能力。

    OpenAI 套用研究主管 Lilian Weng 曾在一篇文章中指出, Agent(智能體)= LLM(大語言模型)+ 記憶(Memory)+ 規劃技能(Planning)+ 工具使用(Tool Use)。

    這是模仿了人類執行任務過程的四個元件,LLM 作為智能體的大腦,其他的關鍵元件執行任務。

  • 拆解和規劃任務的分配
  • 模擬人的記憶類別進行獲取、儲存、保留並檢索資訊
  • 呼叫外部 API 擴充套件模型能力
  • 其實 OPPO 對 AI 手機的定義和 Lilian Weng 關於 Agent 的研究不謀而合,OPPO AI 中心產品總監張峻也跟愛範兒進一步介紹了 OPPO AI 超級智能體的核心邏輯。

    智能體會變成智慧 OS 的大腦和核心,但是我們想做的是全棧的 AI 變化,比如說大家很熟悉的螢幕、麥克風這些器件,OS 中的元件,我們都希望將其 AI 化。

    這個智能體首先也是基於知識圖譜、文件數據以及搜尋引擎來理解使用者意圖。同時基於對使用者的長期記憶以及當下的即時互動語境,針對每個使用者的需求,呼叫多種多樣的工具提供服務,這是和過去的智能電話最大不同。

    很多人認為 AI 手機等同於大模型+手機,其實更準確的說法,應該是 AI Agent 和智能電話的結合。

    當 AI 可以理解使用者的自然語言,基於原生的數據訓練逐漸理解使用者的意圖,過去套用提供的服務和功都能無縫整合到系統中呼叫,吃穿住行娛樂工作所有場景,使用者只要說出需求即可。

    按照這個邏輯,套用的形態也將完全改變。整個互動界面本身就是一個超級 app,使用和開發套用的方式也會完全不同,AI 手機要邁向的就是這個未來。

    至於什麽時候才會看到真正的 AI 旗艦,恐怕還得等等,但我們已經可以在 Find X7 等部份旗艦上看到 AI 手機的雛形。

    比如在打電話時,AI 智能通話摘要功能可以幫我們梳理出通話內容的重點,並且準確地以文件的方式輸出帶有主題、要點、待辦事項的內容摘要,對我這樣經常電話采訪和開線上會議的職場人就很實用。

    春節期間推播的新小布助手,選擇「連麥」在對話時的體驗也更接近真人,甚至可以模擬不同的角色,比如給你推薦最近的上映電影和搜集影評,語音記錄自動轉換文字方便收藏轉發,更接近一個高級的私人助理。

    而前面提到的 AI 消除功能,OPPO 稱推播以來人均每日使用次數已經達到 15 次,這也意味著使用者對 AI 的體驗開始從嘗鮮轉入常用。這也是互動效率、智能程度和便攜性幾個要素共同作用帶來的結果。

    從這些功能,我們也能窺見 OPPO 做 AI 手機的理念和路線: 以產品驅動技術

    如何利用多模態的能力解決使用者高頻高感知復雜任務場景,基於場景和需求來調整大模型的訓練模式,呼叫不同的算力,也將是 AI 手機能否真的區別於目前智能電話,帶來更好體驗的關鍵。

    2024 ,AI 手機的奇異點元年

    2023 年可以說是大模型元年,ChatGPT 和一眾大模型讓我們看到了一個新的可能性,那就是人人都可以擁有賈維斯那樣的超級 AI 助理。

    可即便 ChatGPT 有了手機 app,還是無法真正成為賈維斯,因為很多需求的執行聊天框裏還無法處理,所以 OpenAI 才推出了 GPTs,讓更多人開發屬於自己的智能體。

    但就像我們前面所說的,智能體最適合的硬件載體目前還是智能電話。智能電話從系統開始適配智能體,並衍生出新的套用生態,體驗會更加絲滑。

    目前 AI 手機所需的條件也逐漸成熟,一方面算力成本不菲的通用大模型和行業大模型,都開始需要尋找落地的場景產品化。同時端側模型在流動通訊器材的執行問題逐步被解決,能力更小的記憶體執行更大參數規模的大模型。

    這也是為什麽 2024 年,會被稱為 AI 手機元年。

    其實無論哪個時代,使用者需求應該是被發現,而非憑空創造的,好產品都應該是能洞察不同時代趨勢下的使用者需求。

    正如 Google 前 CEO 艾歷·施密特在的【重新定義公司】一書中的觀點:「技術的未來在於,預測使用者的需求並在使用者意識到這些需求之前就滿足它們。」

    愛範兒曾在一篇文章中指出,AIGC 正在推動社會進入一個「智力盈余」時代。每個人都有機會,擁有無限的「外部智力」,成為超級個體。

    因此,我們的隨身器材應該就是最強外腦的載體。讓每個人口袋裏都有專屬的超級助理,實作 AI 普惠,也是 OPPO 做 AI 手機最大的動力,洞察的是 AIGC 時代的最大需求。

    過去 20 年,OPPO 是為數不多穿越周期的消費電子品牌。 從功能機到智能電話時代,OPPO 的核心競爭力從來不是單點的技術、設計或者功能,而是透視時代的需求,洞察流行本質,不隨波逐流的能力。

    這意味著你無法亦步亦趨,必須主動去做有一定失敗風險的事情。

    率先定義音樂手機品類的 A103,是在便攜式媒體播放器流行的功能機年代,看懂了小鎮青年的娛樂和社交方式

    在智能電話時代,從第一款真正意義上主打自拍美顏的 Ulike U701, 到 Find X7 上和哈蘇宣布打造新一代超光影影像系統,代表了不同時代的情感和個性表達,人們從追逐浮誇的「美顏濾鏡」到欣賞更真實自然的狀態。

    當 AIGC 浪潮來臨,跟隨者蜂擁而至,國產大模型就有 200 多個。率先喊出 AI 手機並非一定贏得頭彩,反而可能被認為質疑跟風,但 OPPO 在 AI 布局其實比我們想象中要早得多。

    早在 2020 年,OPPO 就推出了首個 AI 大模型,並持續進行投入,去年 OPPO 釋出自主訓練的安第斯大模型(AndesGPT),其實也是之前的技術積累,在 Super CLUE 知識與百科能力排行榜上僅次於 GPT 4。

    在昨天的 OPPO AI 戰略釋出會上,雖然劉作虎沒有正面回應在 AI 上投入的資金,但他告訴愛範兒,「在投入上,我們可以說是沒有上限」。

    今年 1 月 OPPO 成立了 AI 中心,把產品、研發、營運、研究院、數碼工程、軟件工程的骨幹聚合在一起,得以像做互聯網產品一樣快速叠代。

    年初釋出的 Find X7 是首款在端側套用 70 億模型的手機,在處理能力、處理時延、視覺生成響應等方面都是 Android 旗艦的第一梯隊。

    OPPO 目前一方面透過量化等技術大幅降低模型在手機執行所需的記憶體,同時利用自建的 OPPO AI 濱海灣數據中心部署 Titan、Turbo、Tiny 三個級別的模型來處理不同的場景需求。

    端雲協同也是目前手機部署 AI 大模型兼顧效率和效能最理想的方式,端側計算可更好保證即時性與私密保護,雲端更強的計算能力則能夠完成像 AI 消除等更復雜的任務。

    IDC 預計, 2024 年全球新一代 AI 手機出貨量將達到 1.7 億部,占智能電話整體出貨量的 15%。中國市場 AI 手機份額也將迅速增長,到 2027 年將占比超過 50%。

    不過要讓 AI 體驗像影像一樣成為影響使用者消費決策,也不會一蹴而就。

    大模型催生出新的數碼化時代,我們的文化、經濟甚至是身份認同都在經歷重塑,AI 手機作為這一變革的重要載體,需要更多 OPPO 這類主流廠商作為貢獻者和普及者,讓更多使用者感受到 AI 帶來的改變,直到與人們的日常生活融為一體。

    過去幾十年,計算器材一直在追求著這樣的未來:自動感知和響應人們的需求,提供智能化的、自然的和無縫的使用者體驗。

    從 PC、智能電話到打造空間計算的 Vision Pro,都在接力讓我們離這個終點更近一點。現在,AI 手機要開始接過這個歷史任務了。