当前位置: 华文世界 > 科技

「百模大战」,上海如何谋求胜算?

2024-02-11科技

「计算机能思考吗?」70多年前,英国数学家图灵提出这个问题后,人类就开始了对人工智能的探索。

随着科技飞跃式发展,ChatGPT横空出世不久,去年,生成式人工智能领域迎来了「百模大战」。

相较于AI1.0时代的判别式人工智能,AI2.0时代的生成式人工智能能力更强、应用更广。从文本对话到吟诗作画,人工智能大模型展示着它们的十八般武艺。在上海,目前已有24款大模型完成备案、可上线提供服务,数量位居全国前列。

「上午好,我是您的财富助手海小慧。」这家银行的手机客户端里,两名数字员工24小时在线,他们需要准确理解用户意图,并给出专业解答。「具体到数字员工的‘智慧大脑’,我们借助大模型的语言理解能力和多模态应用能力,完成了2000条问题数据和10万多条语料的知识库训练,」上海银行网络金融部资深副主管周东华介绍。

作为这一应用场景的大模型底座,这家企业自研的语言大模型,通过千亿级参数等数据训练,能充当编程、健康咨询等各类「助手」;还能帮助行业用户进行自定义模型开发训练。「今天去给它看一篇非常复杂的文章,人工智能可以非常短的时间内,帮你自动给文章做摘要和总结。传统上,我们认为都属于人类的思考推理判断范畴内的能力,今天,我们看到大模型已经越来越多地具备并且呈现出来,」商汤科技联合创始人、上海公司总经理杨帆告诉记者。

算力、算法和数据,是训练人工智能大模型的三个关键要素。

在位于上海徐汇的大模型创新生态社区「模速空间」,挂牌4个多月来,已经迅速集结起约50家大模型相关企业。在这里,「上下楼就是上下游」,灵感的火花在此碰撞、迸发。

在这家企业研发的通用视觉多模态大模型里,输入「90年代、上海黄河路、王家卫电影风格」等关键词,很快,人工智能生成的图片和短视频,就跃然眼前。「我们的模型基于1张图片,去推测后面图片的运动轨迹,把它拼成一起,就是一个4秒的短视频,」智象未来公司品牌负责人张一鸣介绍。目前,研发团队正在加速提升这一大模型能级;而算力紧缺,是当下企业成长过程中遇到的「小烦恼」。

看到下游企业的需求,同在「模速空间」的这家上游企业,自研了软硬件协同智算一体机等设施,能为大模型的研发和算力高效利用提供重要支撑。「能够把GPU(图形处理器)的使用效率提升2到4倍;就是说,我做同样的一个任务,原本需要2秒,现在只需要1秒到半秒,」无问芯穹公司首席执行官夏立雪说。

与此同时,「模速空间」里的五大公共服务平台,也能提供算力调度、大模型备案等支持。

上海大模型生态发展有限公司总经理陈海慈表示:「对标科创中心建设,整个‘模速空间’建设,跟过去做产业园区最大的区别来说,是我们不是以空间载体撑满为目标,而是以创新、创业,或者创新策源的浓度跟动能为评价标准。」

聚焦大模型创新能力、创新要素供给等方面,去年底,上海已正式发布11条举措,为大模型创新发展指明方向。

「我们要通向通用人工智能,还需要在基础研发方面继续往前走;同时,逐渐探索向各个行业落地的可能性,把大模型从闲聊的工具,逐渐变成能够跟场景的需要相结合、深入落地、提供价值的这么一个‘利器’,」上海人工智能实验室领军科学家林达华说。