「百模大战」，上海如何谋求胜算？

2024-02-11科技

「计算机能思考吗？」70多年前，英国数学家图灵提出这个问题后，人类就开始了对人工智能的探索。

随着科技飞跃式发展，ChatGPT横空出世不久，去年，生成式人工智能领域迎来了「百模大战」。

相较于AI1.0时代的判别式人工智能，AI2.0时代的生成式人工智能能力更强、应用更广。从文本对话到吟诗作画，人工智能大模型展示着它们的十八般武艺。在上海，目前已有24款大模型完成备案、可上线提供服务，数量位居全国前列。

「上午好，我是您的财富助手海小慧。」这家银行的手机客户端里，两名数字员工24小时在线，他们需要准确理解用户意图，并给出专业解答。「具体到数字员工的‘智慧大脑’，我们借助大模型的语言理解能力和多模态应用能力，完成了2000条问题数据和10万多条语料的知识库训练，」上海银行网络金融部资深副主管周东华介绍。

作为这一应用场景的大模型底座，这家企业自研的语言大模型，通过千亿级参数等数据训练，能充当编程、健康咨询等各类「助手」；还能帮助行业用户进行自定义模型开发训练。「今天去给它看一篇非常复杂的文章，人工智能可以非常短的时间内，帮你自动给文章做摘要和总结。传统上，我们认为都属于人类的思考推理判断范畴内的能力，今天，我们看到大模型已经越来越多地具备并且呈现出来，」商汤科技联合创始人、上海公司总经理杨帆告诉记者。

算力、算法和数据，是训练人工智能大模型的三个关键要素。

在位于上海徐汇的大模型创新生态社区「模速空间」，挂牌4个多月来，已经迅速集结起约50家大模型相关企业。在这里，「上下楼就是上下游」，灵感的火花在此碰撞、迸发。

在这家企业研发的通用视觉多模态大模型里，输入「90年代、上海黄河路、王家卫电影风格」等关键词，很快，人工智能生成的图片和短视频，就跃然眼前。「我们的模型基于1张图片，去推测后面图片的运动轨迹，把它拼成一起，就是一个4秒的短视频，」智象未来公司品牌负责人张一鸣介绍。目前，研发团队正在加速提升这一大模型能级；而算力紧缺，是当下企业成长过程中遇到的「小烦恼」。

看到下游企业的需求，同在「模速空间」的这家上游企业，自研了软硬件协同智算一体机等设施，能为大模型的研发和算力高效利用提供重要支撑。「能够把GPU（图形处理器）的使用效率提升2到4倍；就是说，我做同样的一个任务，原本需要2秒，现在只需要1秒到半秒，」无问芯穹公司首席执行官夏立雪说。

与此同时，「模速空间」里的五大公共服务平台，也能提供算力调度、大模型备案等支持。

上海大模型生态发展有限公司总经理陈海慈表示：「对标科创中心建设，整个‘模速空间’建设，跟过去做产业园区最大的区别来说，是我们不是以空间载体撑满为目标，而是以创新、创业，或者创新策源的浓度跟动能为评价标准。」

聚焦大模型创新能力、创新要素供给等方面，去年底，上海已正式发布11条举措，为大模型创新发展指明方向。

「我们要通向通用人工智能，还需要在基础研发方面继续往前走；同时，逐渐探索向各个行业落地的可能性，把大模型从闲聊的工具，逐渐变成能够跟场景的需要相结合、深入落地、提供价值的这么一个‘利器’，」上海人工智能实验室领军科学家林达华说。