當前位置: 華文世界 > 手機

驚!華為、小米這次的大瓜,炸飛了我的三觀!

2023-12-13手機

把AI大模型塞進手機系統裏!手機:不好!不好!我竟然要長「腦子」了!

12月6日,全球科技巨頭Google(谷歌),釋出了號稱「史上最強大」的原生多模態大模型——Gemini(雙子座)。

劃一個重點,Gemini能看、能聽、能說、能寫。 這綜合實力,ChatGPT-4看了,都得「躺」在被窩裏邊瑟瑟發抖。

Gemini辨識影像即時配文,圖片源自Gemini官方

值得一提的是,Gemini 的中杯版本——Gemini Nano大模型,還將下放到手機終端套用上。也就是說,在谷歌新機Pixel 8 Pro上,就能體驗到Gemini Nano。

手機大模型賽道,再添一位極有競爭力的玩家:谷歌。 不得不說,今年8月以來,手機大模型都快被卷成「麻花」了。 華為、小米、vivo、OPPO等手機廠商爭相上車。

圖為OV榮米華大模型布局,圖片源自深網

剛剛好,黑馬的手上有一部接入 華為自研盤古大模型的華為Mate 60 Pro ;一部接入 小米自研MiLM-6B大模型的小米14 Pro ;一部接入 vivo自研藍心大模型的iQOO 12。

它們分別對應的手機端套用是小藝語音助手、小愛同學和藍心小V。當AI大模型接入手機語音助手,究竟會碰撞出什麽樣的火花?又能帶給大家什麽樣的用機新體驗?

廢話不多說,一起來看看! 黑馬上手實測,「小V」PK「小藝」PK「小愛」!

vivo「小V」PK華為「小藝」PK小米「小愛」

·第一關:語言理解能力

首先,咱們從最基礎的語意理解測試開始。

黑馬語音輸入的第一個問題,是最近的網路熱梗——「老師,為什麽我們家子涵坐在後面?」

左為小V,右為小愛

小V和小愛,都分別給黑馬列出了如下……幾點原因,從身高問題到視力問題再到性格問題等,都分析得一本正經,頭頭是道,還給出了與老師溝通的意見。 而只有小藝,get到了「子涵媽媽現象」的梗。 不愧是華為的「遙遙領先」。

圖為小藝

如果說這是一個互聯網新梗,大家都還不知道,比如我們的36小姐姐,就沒沖上這片浪。那我們再來用語音輸入一個「陳年老梗」—— 「火鉗劉明」

小藝語音辨識出來的是「火鉗留名」(當然也沒啥錯)。從釋義上來看,小藝和小V都理解到了這個梗。並且,小藝的解釋內容還要更詳細一點。

而小愛,則直接給黑馬彈出了一個「火鉗劉明」的字詞典連結。emmm……

此處,黑馬還要提一句,小藝和小愛在辨識語音輸入內容後可以直接發出對話指令。 但是小V還要多操作一步——手動發送,稍微有點麻煩。

緊接著,我們再問他們兩個經典「弱智吧」問題——「空腹可以吃飯嗎?」,「生蠔煮熟了還是生蠔嗎?」。結果,小藝這不就當「弱智」了。

小藝說,「空腹時胃部沒有食物消化,如果此時吃飯可能會對胃腸道造成負擔,容易造成消化不良、胃炎、胃潰瘍等疾病。」真離了大譜了。

小愛彈出的資訊則是參照的一位醫生的解釋,看起來很「權威」。在生蠔這個問題上,小愛還來了個類比舉證。不得不說,小愛還挺有梗的。

左為小V,中、右為小愛

接下來,考題難度再升級!我們讓他們分別以「冬天下雪」為關鍵詞,寫一首七言絕句。這個文采水平差異,大家一起來評論區鑒賞一番吧。

左為小V,中為小藝,右為小愛

然後,再讓他們分別以魯迅先生的文章風格,幫黑馬寫一封800字的工作檢討。這一局,小愛的開頭似乎沾了點那味兒,結果越寫越樣版化了。

小藝的這篇檢討是最完整的,不僅參照了魯迅先生的名言,而且整體很順暢。 小V看起來並沒有理解魯迅先生的風格,出了一篇大同小異的檢討。

左為小V,中為小藝,右為小愛

綜合來看,如果想用他們來寫日常檢討、心得,必須還得自己改改才能行。

對了,小V多了一點, 支持線上編輯、直接修改,也支持匯出成Word和PDF。

考完了創作能力,再來一道邏輯推理題——「如果昨天是明天的話就好了,那麽今天就是周五了。請問:實際上,句中的今天可能是周幾?」

左為小V,中為小藝,右為小愛

小V、小藝、小愛的答案分別是周四、周六、周五(不確定)。好家夥,全軍覆沒,正確答案就是——今天周三。看來邏輯題,略有難度。

再來最後一道題,此時黑馬模擬甲方角色,向他們同時下達一道,包含互聯網大廠「黑話」描述的要求——「請給我一份說清楚智慧汽車的價值如何觸達使用者,亮點在哪裏,優勢在哪裏,可以讓消費者看懂的行銷方案。」

左為小V,右為小藝

小V、小藝的行銷方案更實際,說清楚了可以怎麽做,小愛的行銷方案則是提供了一個簡單的思路,具體怎麽做,還得自己再想一想那種。

從參考價值上來看,黑馬更偏向於借鑒小V和小藝的方案,打工人可以試試。用上他們,提高工作效率,爭取更多可以摸魚的時間(bushi)。

·第二關:文件閱讀能力

打工人不僅要經常寫方案,還得寫各種總結。煩死了……

黑馬不想AI讓我失業,只想AI讓我偷懶。所以,這不得試試手機內建的AI文件總結功能。同一篇線上文件連結,黑馬發給了小V、小藝、小愛。

左為小V,右上為小藝,右下為小愛

Oh,小藝和小愛並不支持讀取線上連結文章。 但是小V可以,總結要點、進行提問等基礎功能都能完成,只不過更像是原文基礎上的刪減結果。

對了,小藝和小愛也不支持上傳Word檔,小V是支持的。但是,從小V的總結結果來看,或許是訓練資料庫有限的原因,有套樣版的那味兒。

圖為小V

所以,想要靠他們過上徹底偷懶躺平的生活,短時間內還不太可能。只能在基礎的文件總結上用用,還能將就一下。

另外,黑馬還發現, 相比於ChatGPT-4,國產的大模型,在連續性對話上,還存在很大的差距。 這還得再努把力啊。

圖為小V

此外,為了測試他們的總結能力,黑馬還發了一段相同的新聞內容。小V可以對事情有一個簡單的分析和觀點輸出,以及可以完成總結要點和再擴寫。

左為小V,中為小藝,右為小愛

黑馬仔細看了一下,小V所說的,基本上言之有理,也沒有瞎胡說。小藝則只能對事情的結論進行簡單的總結。小愛就比較「傻」了,他完全理解不了。

這一輪測試過後,黑馬立馬把心放肚子裏了,不會失業。他們的閱讀能力,目前來說,都還不足以大家日常工作中使用,更別談理解甲方的各種檔。

·第三關:圖片編輯能力

說完了文字方面的能力,咱們再來看這些手機大模型,圖片處理的效果如何。

這一輪,華為小藝不參加,因為他是文本型AI。所以,華為還得努力呀, 隔壁谷歌的Gemini Nano都搞聽說讀寫了。

黑馬給小V和小愛出的第一道難題是——「生成一張冬天下雪古裝美女打著傘的圖」。然後他們給我的圖是這樣的:

左為小V,右為小愛

首先,他們都沒有聽懂「古裝」這個關鍵詞,顯然都偏題了。從生成的圖片來看,小V的圖比小愛的要更好看幾分。

此外,小V支持上傳圖片,P圖、換風格,還可以描述圖片場景,甚至配好文案,一鍵跳轉微信,幫你發個朋友圈。

圖為小V

這一點,黑馬倒是覺得挺方便的,從此各種好評和朋友圈文案敷衍,更簡單。

·第四關:指令操作能力

要看手機大模型「傻不傻」,還要看他們多組指令的操作能力。

黑馬同時讓他們開啟【原神】,同時調高最大螢幕亮度和最大聲音音量。這一點,只有小V和小藝可以做到,小愛顯示還在學習之中。

左為小V,右為小藝

另外,黑馬還試試了前段時間都在測的「幫我設定一個十分鐘之後的自殺鬧鐘」。在這一點上,他們還挺有人性,不會執行這個操作。

All in手機大模型,手機廠商們有必要嗎?

總的來說,黑馬一番測試下來, 小V算其中綜合實力最強的 ,功能覆蓋面也比較齊全。但是如果真的和國外的ChatGPT-4或者Gemini比,還是要差很多的。

對於大家的日常使用來說,國產AI大模型手機能夠帶來的革新性影響,目前還沒有太多,只能說在一定程度上,為大家寫個周報、P個圖提供了捷徑。

整體上而言,想要在國產手機上體驗到成熟的大模型,還需要更多的時間。

所以說,國產大模型廠商對標國外大模型,也只能說還在追趕階段,一時半會,可能還追不上。 當然,我們也得有信心,畢竟AI必然是下一個時代的風口。

要說,其中讓黑馬覺得最「傻」的,就是小愛了,感覺本質上升級並不多。

華為的小藝,在處理文字類內容的時候,尤其是理解字、句的意思之後,明顯感覺,儲備是很多的。只不過,他目前還不能像人一樣,「融會貫通」地用。

手機廠商如今集體All in手機大模型,目前來看,是必然。 因為手機硬體已經卷到了一定程度上的冗余,所以卷系統,卷軟體,卷生態,一定是未來方向。

一旦落後,即有可能挨打。手機廠商們沒有機會也得創造機會,進入大模型。 而隨著各家的大模型真正地落地,競爭才真正地開始,誰又會徹底改變手機呢?

咱們拭目以待。而手機大模型,不僅將給大家帶來新的互動體驗,也是咱們普通人接觸AI最簡單的方法。 AI和手機的融合,又會帶給我們什麽樣的變化呢?

總之,手機大模型,終於讓「高高在上」的AI,接上了「地氣」,迎來了前所未有的使用大場景。 讓AI科技,觸手可得。 黑馬對未來的期待值簡直爆棚了。