自2022年11月底openAI首次公测ChatGPT以来,人工智能(AI)迎来新一波浪潮,AI产业飞速发展。
「AI在这段时间的发展可以用‘波澜壮阔’来形容。在此前的很长一段时间里,人们其实对AI持一种保留甚至怀疑的态度,直到ChatGPT发布后,人们才发现人工智能真的能够成为一种生产力。」华东师范大学计算机学院副研究员、前华为荣耀Magic手机首席架构师董道国近日对第一财经表示,「这种生产力仍然局限在小范围内,还没有真正颠覆各行各业,但至少这个趋势已经出现了,目前已是暗潮涌动。」
以下为部分交流内容:
第一财经:目前国内的大模型能否对标OpenAI的ChatGPT?
董道国:国内大模型的发展蒸蒸日上,但距离OpenAI发布的GPT4等领先大模型,国内还有很长的路要走,还需要更加努力,特别是那种有资金、有实力的大厂,应该再沉下心来继续努力,至少到目前为止这种差距还是比较大的。
第一财经:这个差距具体体现在哪里?
董道国:这是综合性的表现,大模型不仅仅是算法,还要考虑训练数据、算力以及工程化能力。如果仅仅聚焦于对话模型,国内大模型对中文对话的支持还是可以的,但如果把大模型作为AI Agent(人工智能体)的「大脑」作用去发挥的时候,我们的大模型在推理能力上距离ChatGPT还有蛮远的距离,也就是说仅仅看对话模型其实表现也还可以,但是将AI作为一个生产力,国内大模型还有一定差距。
第一财经:作为AI Agent和作为对话的大模型,它们的主要区别是什么?
董道国:基于大模型的对话应用是给普通人用的,面向C端,利用网页的形式和大模型做一些对话沟通;AI Agent作为一种「大脑」,本质上我们不仅是用它里边的知识,更多地是用它的推理能力去做决策,调用工具和外部知识来完成复杂的任务。
第一财经:国内的大模型未来会成为一个超级 APP 吗?
董道国:会有这样一种趋势。包括一些手机公司做AI终端的目的,就是希望手机继续能够承担所有APP入口。国内包括百度、阿里在发力的大模型,其实也是希望能够承担超级APP的那种角色。
我相信未来随着AI的发展,手机所有APP的形式一定会发生根本性变化。目前APP的形式仍然偏规则式,并不人性化。规则式意味着没有人机对话能力,我们只能根据APP设定的布局来使用,按相应的按键,得到APP的回应,这种模式是反人性的。人最希望直接表达自己的需求而得到满足,而不是点来点去。比如我喊出苹果手机的Siri,让它给我定一个闹钟,它就会直接给我定好。未来随着人工智能的发展,这种功能的适用范围会更广阔,使用起来也会更加便捷。
第一财经:目前各个领域,比如医疗、金融领域都在研发自己的垂域大模型,一些企业也会在一些开源大模型基础之上,结合自己的行业经验和数据积累,推出自己领域的大模型。这给我们一种感觉,大模型的技术门槛是不是没有那么高?
董道国:其实如果有私域的数据,并且数据质量比较高的话,基于现有的一些基座大模型去训练自己的私域大模型,我认为技术上并不是很难。但是训练之后的效果到底怎么样,其实还是要打一个问号,要去看具体的工程方法,训练数据集如何构建需要一定的经验积累。
我一直持有一个观点,当一个企业或者一个行业真的去训练自己的私域大模型的时候,还是需要综合考虑一下,到底是要自己去微调一个大模型,还是用现有大模型去构建一个面向自己行业应用的智能体,要看哪一种方案更符合实际需求。现在很多人其实把RAG(Retrieval Augmented Generation,检索增强生成)和训练私域大模型混淆,我其实更倾向于用RAG 的模式去构建面向某个行业的应用场景。
第一财经:两者的主要区别在哪里?
董道国:微调大模型其实就是在改变大模型的参数,也就是把知识输入到这个大模型里面去。而RAG仅仅用的是大模型的推理能力,而知识源于企业内部自己的数据和知识库。换句话说,第一种模式是把知识灌到大模型里,这有一个缺点:大模型仍然有可能输出它不确定的知识或不清楚的信息,从而造成一些幻觉,导致内容真伪难辨。但是RAG模式通常没使用大模型里的知识,只用了大模型自然语言的理解和推理能力,知识通过检索知识库后送给大模型,让它来根据限定的知识去生成。
第一财经:L0通用大模型和L1垂域大模型,它们目前的商业化进程如何?未来什么样的大模型更容易变现?
董道国:其实如果资金实力比较雄厚的话,那么做L0通用大模型是一件值得去鼓励的事情,但面临应用落地的问题。通用大模型投入很高,变现路径比较长,所以需要持续的资金支持。国家需要这样的L0级大模型出现,所以我觉得这件事情需要由那些有实力的大厂去持续投入。而在一个行业应用里,我认为垂域大模型可能更容易发挥实质性作用。
我倒不建议专门成立一家公司去做垂域大模型,而是应该由已经有明确应用场景的企业,去利用这种通用大模型来优化业务流程,能够马上发挥作用,这种情况更容易成功。如果一个创业团队自己去想象一个行业场景,然后去训练垂类大模型,再销售出去,压力会非常大。所以我一直觉得不应该鼓励过多的创业公司投入到思考应用场景上,应用场景去找技术会比较好。