當前位置: 華文世界 > 科技

「AI技術」讓你能聽懂狗語,正確率超80%

2024-10-28科技

人工智能時代已來

機器轉譯揭示的世界

AI總是以驚人的速度發展、演進、蛻變、湧現。AI轉譯領域有了新進展,這個進展可能不是那麽起眼,對你的生活也許沒有那麽大的影響,但它是一次人類文明意義上的突破:現在人與寵物、人與野生動物、大人和剛出生的嬰兒之間,可以交流了。

就好像童話世界一樣。AI能幫你跟你家的寵物狗對話,你走在公園裏能聽懂路鳥的叫聲,更不用說媽媽知道寶寶這次哭是因為餓了還是因為疼痛,你說這多好。這些事情現在已經成為,或者至少在技術上可以成為現實。

當然這不只是技術問題,還有科學認知上的突破。語言學家馬上就會問:動物真的有語言嗎?當那些鳥在嘰嘰喳喳、寵物狗對著你汪汪汪的時候,它們到底是真的想表達一個什麽特定的意思,還是只不過是在用一些隨機的叫聲抒發情緒呢?還有,每種動物的語言都是統一的嗎?它們有外語和方言嗎?

以前的學者研究這些問題是很困難的,需要觀察很久不說,關鍵是沒有趁手的工具。現在有了AI,更具體地說就是機器學習的方法,研究者,包括在套用層面,已經做出了突破性的成果。

人懂狗語

人能懂狗語

矽谷有一位連續創業者,叫孫鄰家(Arvin Sun)。他搞了個非常火的AI創業公司,研發了一款能在寵物語言和人的語言之間互相轉譯的手機套用,叫 Traini。

你家小狗對你汪汪叫,你用手機接收一下它的叫聲,最好再結合表情影像,traini 就會轉譯成人的語言,你就知道它叫的是什麽意思。你對著APP說一句指令,手機會把它轉譯成汪汪汪,然後狗狗真聽懂了。

一般人聽不出來每一句汪汪汪有多大區別,但AI可以分別。孫鄰家的公司專門訓練了一個狗狗叫聲辨識AI模型,叫 PetGPT,現在辨識準確率達到了81.5%。他們已經拿到了千萬美元的融資,跟很多個大品牌展開了合作,會把模型用在多個場景和不同硬件上,比如讓機器狗和寵物狗直接對話。

孫鄰家回答了我的一些疑問。不同品種的狗跟人互動時的表現的確不同,需要區別對待。另外狗的體型大小也很有關系,比如面對危險的時候,小體型的狗叫的聲音是尖而且快,大狗則是低沈。不過這些對AI都不成問題。

萬物之靈

這只是開始的開始

人和黑猩猩的語言有個本質區別。人的語言很大程度上是個文化現象,每個族群、每個地區都有自己的語言,需要後天學習才行;而黑猩猩的語言則是一個反射性的情緒表達系統,是一種本能的「叫聲」,不需要學習,同一種黑猩猩的叫聲是一樣的。

這恰恰就給了 Traini 一個機會:你不需要專門對比如說中國東北的狗狗、美國加州的狗狗和日本的狗狗分別訓練,它們只要是一個品種,叫聲和表情就不會差太多。

當然既然是叫聲,就不能傳達特別復雜的意思,你不能指望狗狗跟你聊美國大選 —— 但是能把那些動物性的意思都準確辨識,就已經很有用了。狗狗對你叫,它到底是餓了,還是有點害怕,還是想回家呢?以前全靠猜,現在AI幫它轉譯。

而辨識寵物叫聲,只是掀開了大幕的一角,以後我們能夠聽懂一些動物的語言,成為萬物之靈指日可待,這只是開始的開始。