数据作为一种新兴的生产要素,被称为数字时代的「新石油」,是基础性资源和战略性资源,也是重要的生产力。如何更高效地管理和利用数据,推动数据资源转化为数字资产,成为了各行各业面临的关键问题。
近两年来,国家先后发布【关于构建数据基础制度更好发挥数据要素作用的意见】、【数字中国建设整体布局规划】等政策,以促进数据、分析和AI在经济中的应用。在【数字中国建设整体布局规划】中还提及,到2025年要基本形成横向打通、纵向贯通、协调有力的一体化推进格局,实现数据资源规模和质量加快提升,数据要素价值有效释放,数字经济发展质量效益大幅增强。
值得注意的是,目前数据编织平台正通过对数据的优质处理,为AI在学习训练的过程注入更多「源头活水」,从而进一步提升其性能和应用范围。AI技术的不断进步也推动数据构建架构的优化、更新,以适应新的生成模型需求。
由于对数据编织架构、数据产品交付以及支持生成式AI的集成数据的需求即将到来,数据集成工具市场正在蓬勃发展。数据和分析领导者应该利用这项研究来评估合适的供应商,以满足他们的数据集成需求。
权威信息技术分析公司Gartner连续三年将数据编织技术(Data Fabric)列为「十大数据和分析技术趋势」之一。在该公司此前发布的中国数据分析与人工智能技术的相关报告中,数据编织技术与大模型一并被列为有望膨胀发展的技术。
Gartner高级研究总监张桐也表示:「数据、分析和AI用例的出现,以及快速变化的数据安全法规,导致了中国数据管理的复杂性和不确定性。数据编织能充分利用沉没成本,同时也能为数据管理基础设施方面的新支出提供优先级排序和成本控制指导。」
据悉,数据编织是一种设计框架,用于获得灵活而且可复用的数据管道、服务和语义,涉及数据集成、主动元数据、知识图谱、数据剖析、机器学习和数据分类。能集成来自不同数据源的数据,安全提供不同数据对象的「集成视图」,将「集成数据」用于分析和操作。
数据编织相关技术的应用能提供值得信赖的数据基础,提高生成模型的相关性和准确性,成为解决企业AI部署难题的重要路径。与此同时,生成式AI也降低了数据管理的使用门槛,大大拓展了数据编织的应用规模。生成式AI与数据编织互利共进,正为数据管理市场带来更大的发展机遇。
以全球性的制药公司为例,在进行药物的生产、商品化、零售运营的过程中,会用到大量数据,后续生产的产品进入到医院端,还需要进行各种临床数据验证,不同的阶段都会出现不同的表现。在这个过程中,制药公司不仅要获取各种健康相关的数据,还要在每一个垂类中,针对面临的难点、痛点,获得高质量并且不违规、不会涉及隐私侵犯的数据。
面对如此庞大的数据量,数据编织的重要性显得尤为突出。钛媒体APP了解到,应对数据量陡增,数据编织被认为能为海量数据快速、有序分析提供有效方案,以虚拟化的方式对数据进行「编织」,使得数据无需复制就可以整合,且不受数据源、格式的限制,还隐藏了数据本身的复杂性和差异性。
在近期召开的数据编织研讨会上,数据管理领域的资深专家、被称为「逻辑数据编织之父」的Denodo技术公司首席执行官兼创始人Angel Viña表示,从物理数据库、数据仓库到现在的数据湖,传统的数据管理侧重于将数据集中到单个存储单元中,需要大量开发人员,一旦数据源变化频繁更新,获取数据的效率就会大幅降低。逻辑数据编织可以使用更少的资源、更低的成本,实现更快的数据获取时间,也由此成为数据管理新的发展方向。
据了解,Denodo于1999年创立于西班牙,目前已为金融保险、制造、高新技术、零售、教育、医疗、能源等行业客户提供服务,并且多年蝉联Gartner魔力象限数据集成工具领导者、Forrester Wave数据编织领导者位置。
2019年,Denodo正式进入中国,在基于企业数字化转型各类项目场景与需求,为企业不同关键角色带来显著价值及成果。如帮助CDO及数据管理部门打造数据民主化的数据自助服务,帮助CIO及IT部门实现IT 基础设施现代化,帮助COO及运营部门提高运行效率、灵活性和韧性,为CMO、CRO及市场与收入部门打造改善客户体验的数据基础,以及实现风险、合规的集中管理等。
此外,在大量数据需求的基础下,Denodo进行统一的数据处理,以便其获得更高质量的信息,并在需要时「随取随用」;而在IT领域,Denodo则支持数据迁移、相关数据的合规使用、建模过程等。
根据IDC机构调研的数据显示,2023年,中国大数据市场规模达到194.8亿美元,预计到2027年将增长至425亿美元,CAGR(复合增长率)将达到21.5%,硬件服务器、AI数据存储仍是投资重点方向。此外,企业认为有60%的业务数据是有价值的,而这些数据中仅有56%被实际分析;有18%的企业认为「缺乏高质量数据」是其在组织中使用生成式AI的障碍之一。
IDC中国高级分析师李浩然指出,决策者普遍预测企业未来的数据量、数据速度以及多样性会增加,以需要满足更加快速的业务决策和市场挖掘探索需求。同时,他还表示:「未来五年,资产绩效管理、创新研发、数据探索将会更加重要,而数据编织作为一种最佳实现路径,可以实现对数据更好的管理和价值挖掘。」
目前数据编织技术在国内的发展还处于早期阶段,在政策利好及市场需求驱动下,中国数据市场规模正迎来快速增长,数据管理需求持续升高。对于中国企业来说,能否激活数据要素、释放数据价值,成为在激烈的全球竞争中取得先机的关键。(本文首发于钛媒体 APP,作者|陈伟纳)