关键词:大数据采集
中商情报网讯:海量数据从生产到发挥价值,需要经过采集、处理、分析等环节,其中大数据采集与预处理作为大数据生命周期的第一环节,是释放数字价值的前提。
市场规模分析
在政策和技术的双重驱动下,我国大数据产业规模快速增长。数据显示,我国大数据市场规模由2016年的277亿元增长至2020年的713亿元,复合年均增长率为26.7%,预计2022年我国大数据市场规模将达1049亿元。
数据来源:中商产业研究院整理
未来发展趋势
1.大数据行业应用的深入促进大数据采集需求日益增长
数据采集是大数据在各行各业应用并且创造价值的前提。随着大数据的行业应用不断深入,物联网、智能家居、数字政务等领域的大数据技应用逐渐成熟,数据采集的需求也将被逐步激发,带动数据采集软件及服务的市场规模日益增长。
2.大数据采集环节更加注重异构数据源兼容性
随着数据量的指数增长,数据的存储、计算、部署等方式都在同步变化,各行业的业务系统也变得越来越复杂。日益复杂的业务系统和数据架构形成了数据结构、存取方式、形式不同的异构数据源,对大数据采集的异构兼容性提出了更高的要求。工信部发布的《“十四五”大数据产业发展规划》中明确提出,以构建稳定高效产业链为主要目标,在数据生成采集环节,着重提升产品的异构数据源兼容性、大规模数据集采集与加工效率。
3.大数据采集的安全与隐私保护需求持续上涨
近年来,我国大数据的安全与隐私保护需求持续上涨,大数据采集过程中的安全流通和隐私计算技术也愈发得到重视。随着大数据的不断发展和应用,越来越多的安全问题随之浮现。在数据采集过程中,第三方可能在采集传输数据过程中截获、伪造数据,不但造成了用户隐私、敏感数据泄露的严重后果,同时也影响了政府、企业后台数据分析的准确性。因此,在大数据采集及预处理过程中,除了假流量数据清洗、正常数据补全、无效数据剔除外,还存在数据格式化、数据隔离、数据加密、数据脱敏和攻击识别等需求。