把AI大模型塞進手機系統裏!手機:不好!不好!我竟然要長「腦子」了!
12月6日,全球科技巨頭Google(谷歌),釋出了號稱「史上最強大」的原生多模態大模型——Gemini(雙子座)。
劃一個重點,Gemini能看、能聽、能說、能寫。 這綜合實力,ChatGPT-4看了,都得「躺」在被窩裏邊瑟瑟發抖。
Gemini辨識影像即時配文,圖片源自Gemini官方
值得一提的是,Gemini 的中杯版本——Gemini Nano大模型,還將下放到手機終端套用上。也就是說,在谷歌新機Pixel 8 Pro上,就能體驗到Gemini Nano。
手機大模型賽道,再添一位極有競爭力的玩家:谷歌。 不得不說,今年8月以來,手機大模型都快被卷成「麻花」了。 華為、小米、vivo、OPPO等手機廠商爭相上車。
圖為OV榮米華大模型布局,圖片源自深網
剛剛好,黑馬的手上有一部接入 華為自研盤古大模型的華為Mate 60 Pro ;一部接入 小米自研MiLM-6B大模型的小米14 Pro ;一部接入 vivo自研藍心大模型的iQOO 12。
它們分別對應的手機端套用是小藝語音助手、小愛同學和藍心小V。當AI大模型接入手機語音助手,究竟會碰撞出什麽樣的火花?又能帶給大家什麽樣的用機新體驗?
廢話不多說,一起來看看! 黑馬上手實測,「小V」PK「小藝」PK「小愛」!
vivo「小V」PK華為「小藝」PK小米「小愛」
·第一關:語言理解能力
首先,咱們從最基礎的語意理解測試開始。
黑馬語音輸入的第一個問題,是最近的網絡熱梗——「老師,為什麽我們家子涵坐在後面?」
左為小V,右為小愛
小V和小愛,都分別給黑馬列出了如下……幾點原因,從身高問題到視力問題再到性格問題等,都分析得一本正經,頭頭是道,還給出了與老師溝通的意見。 而只有小藝,get到了「子涵媽媽現象」的梗。 不愧是華為的「遙遙領先」。
圖為小藝
如果說這是一個互聯網新梗,大家都還不知道,比如我們的36小姐姐,就沒沖上這片浪。那我們再來用語音輸入一個「陳年老梗」—— 「火鉗劉明」 。
小藝語音辨識出來的是「火鉗留名」(當然也沒啥錯)。從釋義上來看,小藝和小V都理解到了這個梗。並且,小藝的解釋內容還要更詳細一點。
而小愛,則直接給黑馬彈出了一個「火鉗劉明」的字詞典連結。emmm……
此處,黑馬還要提一句,小藝和小愛在辨識語音輸入內容後可以直接發出對話指令。 但是小V還要多操作一步——手動發送,稍微有點麻煩。
緊接著,我們再問他們兩個經典「弱智吧」問題——「空腹可以吃飯嗎?」,「生蠔煮熟了還是生蠔嗎?」。結果,小藝這不就當「弱智」了。
小藝說,「空腹時胃部沒有食物消化,如果此時吃飯可能會對胃腸道造成負擔,容易造成消化不良、胃炎、胃潰瘍等疾病。」真離了大譜了。
小愛彈出的資訊則是參照的一位醫生的解釋,看起來很「權威」。在生蠔這個問題上,小愛還來了個類比舉證。不得不說,小愛還挺有梗的。
左為小V,中、右為小愛
接下來,考題難度再升級!我們讓他們分別以「冬天下雪」為關鍵詞,寫一首七言絕句。這個文采水平差異,大家一起來評論區鑒賞一番吧。
左為小V,中為小藝,右為小愛
然後,再讓他們分別以魯迅先生的文章風格,幫黑馬寫一封800字的工作檢討。這一局,小愛的開頭似乎沾了點那味兒,結果越寫越樣版化了。
小藝的這篇檢討是最完整的,不僅參照了魯迅先生的名言,而且整體很順暢。 小V看起來並沒有理解魯迅先生的風格,出了一篇大同小異的檢討。
左為小V,中為小藝,右為小愛
綜合來看,如果想用他們來寫日常檢討、心得,必須還得自己改改才能行。
對了,小V多了一點, 支持線上編輯、直接修改,也支持匯出成Word和PDF。
考完了創作能力,再來一道邏輯推理題——「如果昨天是明天的話就好了,那麽今天就是周五了。請問:實際上,句中的今天可能是周幾?」
左為小V,中為小藝,右為小愛
小V、小藝、小愛的答案分別是周四、周六、周五(不確定)。好家夥,全軍覆沒,正確答案就是——今天周三。看來邏輯題,略有難度。
再來最後一道題,此時黑馬模擬甲方角色,向他們同時下達一道,包含互聯網大廠「黑話」描述的要求——「請給我一份說清楚智能汽車的價值如何觸達使用者,亮點在哪裏,優勢在哪裏,可以讓消費者看懂的行銷方案。」
左為小V,右為小藝
小V、小藝的行銷方案更實際,說清楚了可以怎麽做,小愛的行銷方案則是提供了一個簡單的思路,具體怎麽做,還得自己再想一想那種。
從參考價值上來看,黑馬更偏向於借鑒小V和小藝的方案,打工人可以試試。用上他們,提高工作效率,爭取更多可以摸魚的時間(bushi)。
·第二關:文件閱讀能力
打工人不僅要經常寫方案,還得寫各種總結。煩死了……
黑馬不想AI讓我失業,只想AI讓我偷懶。所以,這不得試試手機內建的AI文件總結功能。同一篇線上文件連結,黑馬發給了小V、小藝、小愛。
左為小V,右上為小藝,右下為小愛
Oh,小藝和小愛並不支持讀取線上連結文章。 但是小V可以,總結要點、進行提問等基礎功能都能完成,只不過更像是原文基礎上的刪減結果。
對了,小藝和小愛也不支持上傳Word檔,小V是支持的。但是,從小V的總結結果來看,或許是訓練數據庫有限的原因,有套樣版的那味兒。
圖為小V
所以,想要靠他們過上徹底偷懶躺平的生活,短時間內還不太可能。只能在基礎的文件總結上用用,還能將就一下。
另外,黑馬還發現, 相比於ChatGPT-4,國產的大模型,在連續性對話上,還存在很大的差距。 這還得再努把力啊。
圖為小V
此外,為了測試他們的總結能力,黑馬還發了一段相同的新聞內容。小V可以對事情有一個簡單的分析和觀點輸出,以及可以完成總結要點和再擴寫。
左為小V,中為小藝,右為小愛
黑馬仔細看了一下,小V所說的,基本上言之有理,也沒有瞎胡說。小藝則只能對事情的結論進行簡單的總結。小愛就比較「傻」了,他完全理解不了。
這一輪測試過後,黑馬立馬把心放肚子裏了,不會失業。他們的閱讀能力,目前來說,都還不足以大家日常工作中使用,更別談理解甲方的各種檔。
·第三關:圖片編輯能力
說完了文字方面的能力,咱們再來看這些手機大模型,圖片處理的效果如何。
這一輪,華為小藝不參加,因為他是文本型AI。所以,華為還得努力呀, 隔壁谷歌的Gemini Nano都搞聽說讀寫了。
黑馬給小V和小愛出的第一道難題是——「生成一張冬天下雪古裝美女打著傘的圖」。然後他們給我的圖是這樣的:
左為小V,右為小愛
首先,他們都沒有聽懂「古裝」這個關鍵詞,顯然都偏題了。從生成的圖片來看,小V的圖比小愛的要更好看幾分。
此外,小V支持上傳圖片,P圖、換風格,還可以描述圖片場景,甚至配好文案,一鍵跳轉微信,幫你發個朋友圈。
圖為小V
這一點,黑馬倒是覺得挺方便的,從此各種好評和朋友圈文案敷衍,更簡單。
·第四關:指令操作能力
要看手機大模型「傻不傻」,還要看他們多組指令的操作能力。
黑馬同時讓他們開啟【原神】,同時調高最大螢幕亮度和最大聲音音量。這一點,只有小V和小藝可以做到,小愛顯示還在學習之中。
左為小V,右為小藝
另外,黑馬還試試了前段時間都在測的「幫我設定一個十分鐘之後的自殺鬧鐘」。在這一點上,他們還挺有人性,不會執行這個操作。
All in手機大模型,手機廠商們有必要嗎?
總的來說,黑馬一番測試下來, 小V算其中綜合實力最強的 ,功能覆蓋面也比較齊全。但是如果真的和國外的ChatGPT-4或者Gemini比,還是要差很多的。
對於大家的日常使用來說,國產AI大模型手機能夠帶來的革新性影響,目前還沒有太多,只能說在一定程度上,為大家寫個周報、P個圖提供了捷徑。
整體上而言,想要在國產手機上體驗到成熟的大模型,還需要更多的時間。
所以說,國產大模型廠商對標國外大模型,也只能說還在追趕階段,一時半會,可能還追不上。 當然,我們也得有信心,畢竟AI必然是下一個時代的風口。
要說,其中讓黑馬覺得最「傻」的,就是小愛了,感覺本質上升級並不多。
華為的小藝,在處理文字類內容的時候,尤其是理解字、句的意思之後,明顯感覺,儲備是很多的。只不過,他目前還不能像人一樣,「融會貫通」地用。
手機廠商如今集體All in手機大模型,目前來看,是必然。 因為手機硬件已經卷到了一定程度上的冗余,所以卷系統,卷軟件,卷生態,一定是未來方向。
一旦落後,即有可能挨打。手機廠商們沒有機會也得創造機會,進入大模型。 而隨著各家的大模型真正地落地,競爭才真正地開始,誰又會徹底改變手機呢?
咱們拭目以待。而手機大模型,不僅將給大家帶來新的互動體驗,也是咱們普通人接觸AI最簡單的方法。 AI和手機的融合,又會帶給我們什麽樣的變化呢?
總之,手機大模型,終於讓「高高在上」的AI,接上了「地氣」,迎來了前所未有的使用大場景。 讓AI科技,觸手可得。 黑馬對未來的期待值簡直爆棚了。