Sora影片场景(来源:OpenAI)
钛媒体App获悉,2月20日下午, 人民网旗下数据管理平台「人民数据」发布【人民数据打造全球最大中文语义语料库助力Sora新场景】,声称已打造近3亿条数据的新闻、问答等语义语料库。
这则消息引发市场广泛关注。随后,人民网(603000.SH)股价涨停,涨幅达10%,最新报25.64元/股。
2月20日下午,钛媒体App方面通过电话向有关负责人询问更多信息。 人民网一位与该事件有关的消息人士向钛媒体App独家回应称:「对(文章属实)。这应该是我们在新的一年(2024年)业务主打的一些亮点与方向。」
官网显示,人民数据管理有限公司系人民日报、人民网旗下的平台,公司致力于构建全方位的大数据运营生态系统,使大数据更加便捷、高效地服务于经济社会发展,为各行各业广泛应用。作为新时代大数据领域中的 「国家队」, 人民数据管理有限公司以承建国家大数据灾备中心、国家应急数据中心、智慧党建数据中心等国家大数据项目为契机,打造安全、高效、开放、共享的国家级大数据平台,并致力于做好各级党政机关、央国企、民企等大数据的 「存、管、用」 工作。
2月16日,美国OpenAI公司宣布推出全新的生成式人工智能模型「Sora」。通过文本指令,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色,引发全球关注。
OpenAI表示,Sora是能够理解和模拟现实世界的模型的基础,这一能力将是实现AGI(通用人工智能)的重要里程碑。
人民数据在文章中表示,这是全球最大、助力Sora场景的中文语义语料库。
文章中透露,该语义语料库面向人工智能大模型、通用人工智能、智能互联网等应用场景。针对当前大模型普遍回答不了、回答不好却又必须直面、不容回避的重大问题、敏感问题、疑难问题、复杂问题,梳理了1万余个重点问题。语料库的进一步丰富充实或将使资料查找更加便捷,进一步降低了普通人的AI使用门槛,帮助普通人以更简单的方式获取更全面的信息。
但人民数据方面没有透露该语义语料库的更多中文名称以及细节等。
人民数据方面也提醒,AI 技术和应用创新,「合规」始终是底线。未来还需加强对AI大模型安全、规范、可持续发展的探索,充分挖掘各类数据资源价值,以构建主流价值语料库为抓手,推动中国AI产业安全发展。
(本文首发钛媒体App,作者|林志佳)