
非结构化数据占比和数据量齐上升,数据共享与利用需要付出更高代价
运营效率重视度上升的同时,数字环境的发展却阻碍了运营效率的提升。数据包括结构化数据和非结构化数据,结构化数据通常来自于标准化的生产系统或业务系统,格式较为一致,数据的收集与处理比较方便。相比之下,非结构化数据样式众多,包括图片、文档、邮件、日志等,需要进行人工点击、浏览等操作从这些数据中提取所需信息。因而,企业需要花费更多的人力成本去收集、处理非结构化数据。非结构化数据占比目前在80%左右,但是利用率仅有30%,并且随着中国数据量的增加,2025年中国数据量预计将增加至49ZB,约为2020年的4倍,其中非结构数据占比也将越来越高,因而非结构化数据收集、处理的挑战也将越来越重。
01
常见结构化数据来源
交易和销售系统
客户关系管理系统(CRM)企业资源规划系统(ERP)人力资源系统(HRMS)
财务会计系统数据湖和数据仓
…..
+
02
常见非结构化数据来源
文件系统电子邮件文档与报告多媒体内容
社交媒体平台日志和事件记录
…..
+ 175
201520202025e2030e
中国年数据量(ZB)中国年数据量全球占比(%)
来源:wind,艾瑞咨询研究院整理及绘制。来源:wind,艾瑞咨询研究院整理及绘制。