当前位置: 华文世界 > 科技

「AI技术」让你能听懂狗语,正确率超80%

2024-10-28科技

人工智能时代已来

机器翻译揭示的世界

AI总是以惊人的速度发展、演进、蜕变、涌现。AI翻译领域有了新进展,这个进展可能不是那么起眼,对你的生活也许没有那么大的影响,但它是一次人类文明意义上的突破:现在人与宠物、人与野生动物、大人和刚出生的婴儿之间,可以交流了。

就好像童话世界一样。AI能帮你跟你家的宠物狗对话,你走在公园里能听懂路鸟的叫声,更不用说妈妈知道宝宝这次哭是因为饿了还是因为疼痛,你说这多好。这些事情现在已经成为,或者至少在技术上可以成为现实。

当然这不只是技术问题,还有科学认知上的突破。语言学家马上就会问:动物真的有语言吗?当那些鸟在叽叽喳喳、宠物狗对着你汪汪汪的时候,它们到底是真的想表达一个什么特定的意思,还是只不过是在用一些随机的叫声抒发情绪呢?还有,每种动物的语言都是统一的吗?它们有外语和方言吗?

以前的学者研究这些问题是很困难的,需要观察很久不说,关键是没有趁手的工具。现在有了AI,更具体地说就是机器学习的方法,研究者,包括在应用层面,已经做出了突破性的成果。

人懂狗语

人能懂狗语

硅谷有一位连续创业者,叫孙邻家(Arvin Sun)。他搞了个非常火的AI创业公司,研发了一款能在宠物语言和人的语言之间互相翻译的手机应用,叫 Traini。

你家小狗对你汪汪叫,你用手机接收一下它的叫声,最好再结合表情图像,traini 就会翻译成人的语言,你就知道它叫的是什么意思。你对着APP说一句指令,手机会把它翻译成汪汪汪,然后狗狗真听懂了。

一般人听不出来每一句汪汪汪有多大区别,但AI可以分别。孙邻家的公司专门训练了一个狗狗叫声识别AI模型,叫 PetGPT,现在识别准确率达到了81.5%。他们已经拿到了千万美元的融资,跟很多个大品牌展开了合作,会把模型用在多个场景和不同硬件上,比如让机器狗和宠物狗直接对话。

孙邻家回答了我的一些疑问。不同品种的狗跟人互动时的表现的确不同,需要区别对待。另外狗的体型大小也很有关系,比如面对危险的时候,小体型的狗叫的声音是尖而且快,大狗则是低沉。不过这些对AI都不成问题。

万物之灵

这只是开始的开始

人和黑猩猩的语言有个本质区别。人的语言很大程度上是个文化现象,每个族群、每个地区都有自己的语言,需要后天学习才行;而黑猩猩的语言则是一个反射性的情绪表达系统,是一种本能的「叫声」,不需要学习,同一种黑猩猩的叫声是一样的。

这恰恰就给了 Traini 一个机会:你不需要专门对比如说中国东北的狗狗、美国加州的狗狗和日本的狗狗分别训练,它们只要是一个品种,叫声和表情就不会差太多。

当然既然是叫声,就不能传达特别复杂的意思,你不能指望狗狗跟你聊美国大选 —— 但是能把那些动物性的意思都准确识别,就已经很有用了。狗狗对你叫,它到底是饿了,还是有点害怕,还是想回家呢?以前全靠猜,现在AI帮它翻译。

而识别宠物叫声,只是掀开了大幕的一角,以后我们能够听懂一些动物的语言,成为万物之灵指日可待,这只是开始的开始。