数据基础设施白皮书2019免费下载.pdf
《数据基础设施白皮书2019免费下载.pdf》由会员分享,可在线阅读,更多相关《数据基础设施白皮书2019免费下载.pdf(24页珍藏版)》请在悟道方案网上搜索。
1、数据基础设施白皮书 2019 目录 目录 数据正在成为数字经济发展关键生产资料 数据应用的现状总结 构建数据基础设施迎接变化与挑战 总结与展望 02 07 11 20 1.1 数字经济蓬勃发展,深刻改变了生产、生活方式 1.2 数据的有效应用正成为经济社会发展的强劲驱动力 1.3 新技术持续推动数据爆发增长 - 03 - 04 - 05 - 08 - 08 - 09 - 12 - 13 2.1 存不下数字化浪潮下的海量数据存储挑战 2.2 流不动由来已久的数据孤岛难题 2.3 用不好数据供应不足造成
2、应用复杂低效 3.1 数据基础设施定义 3.2 数据基础设施的特征与趋势 3.2.1 融合 3.2.2 协同 3.2.3 智能 3.2.4 安全 3.2.5 开放 前言 前言 人类社会几千年来经历了农业经济、工业经济,如今已经进入到数字经济时代。根据联合国2019 年数字经济报告的统计,数字经济的规模估计占全球生产总值的4.5%至15.5%之间,其中中国和美国 是引领世界数字经济发展的核心。中国互联网发展报告2019指出,2018年,中国数字经济规模达 31.3万亿元,占GDP比重达34.8%,数字经济已成为中国经济增长的新引擎,正在深刻改变全社会的生 产和生活方式。 虽然学界对数字经济的构成
3、模式和理论体系还没有清晰的界定,但数据作为数字经济时代最有价值的 生产资料已经是毋庸置疑的共识。云计算、大数据、物联网、移动互联网、人工智能等ICT新技术、新模 式的发展和应用无一不是以海量数据为基础,又反过来带动了数据量的爆发式增长。 就像石油的“采-运-炼-储-用”是工业经济的核心命脉一样,面向海量数据的“采-存-算-管- 用”是支撑数字经济运行的基础能力。海量数据蕴含巨大的价值,也带来了前所未有的挑战,数据“存 不下、流不动、用不好”成为了各行业数据应用最普遍的难题,以“融合、协同、智能、安全、开放” 为特征的新型数据基础设施可以帮助各行业实现数据存储智能化、管理简单化和价值最大化,是推
4、动各 行业拥抱数字经济浪潮的关键因素之一。 在此背景下,中国信息通信研究院和华为技术有限公司共同编写了数据基础设施白皮书 2019, 力图从数据应用的现状与问题出发,总结数据基础设施的内涵与技术特征。在研究的过程中我们认识 到,目前对数据基础设施的理解还是非常初步的,数据基础设施是涉及经济、技术,乃至社会发展的宏 大命题,这本白皮书只是后续研究的一个起点。我们希望未来能够与产业界和各行业专家共同探讨、研 究,不断厘清数字经济大背景下数据基础设施的概念与需求,更好的指导技术、产业和应用的发展。 01 数据正在成为数字经济发展 关键生产资料 01 02 数字经济成为经济发展新动能 受国际经济形势与
5、国内经济结构性改革等因素影响,从2007年起,中国GDP增速从14.2%回落到 2015年起的6.9%,经济增速由高速转变为中高速,中国经济进入“新常态”。过去十年,中国数字经 济的持续稳定快速发展,成为稳定经济增长的重要途径。2008年,我国数字经济占GDP比重仅为 15.22%,2018年我国数字经济规模达31.3万亿元,占GDP比重34.8%,数字经济发展对GDP增长贡 献率达到67.9%,超越部分发达国家水平。 20082018年,我国数字经济增速显著高于同期GDP增速,并且自2011年以来,数字经济与GDP 增速差距有扩大趋势,按照可比口径,2018年我国数字经济名义增长率为20.9
6、%,高于同期GDP名义 增速约11.2个百分点。随着数字化加速向传统产业融合渗透,数字经济对经济增长的拉动作用将愈发凸显。 数字经济深刻改变了生产、生活方式 移动互联网改变日常生活。中国已经成为全球最大的移动互联网市场,数据显示,截至2018年12 月,中国手机网民规模已达8.17亿,用户需求的巨大网络效应带来了一系列广泛的创新,电子商务、网 络支付、共享单车、人工智能等新兴领域正迅速重构每一个中国人的生活方式,从而形成日常生活中的 数字浪潮。以电子商务为例,十年前中国的零售电商交易额不到全球总额1%,如今占比已超过40%,超 过法、德、日、英、美五国的总和。 来源:中国数字经济发展与就业白皮
7、书(2019年) 40% 30% 20% 10% 0% 数字经济增速显著高于同期GDP增速 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 数字经济增速 GDP增速 1.1 数字经济蓬勃发展,深刻改变了生产、生活方式 数据正在成为数字经济发展关键生产资料 03 数据是数字经济时代的核心生产要素 社会已经迎来了继农业经济、工业经济之后的数字经济时代,如同农业时代的土地、劳动力,工业 时代的技术、资本一样,数据已经成为数字经济时代的生产要素,而且是最核心的生产要素,数据甚至 被认为已经超
8、过石油的价值。数据驱动型创新正在向经济社会、科技研发等各个领域扩展,成为国家创 新发展的关键形式和重要方向。 数据有效应用推动经济社会发展 各行各业加速数字化进程,对数据的有效应用成为关键。 提高金融风控能力。美国银行2015年的一份调查研究指出,银行每创收100万美元,会平均产生 820GB的数据,业务数据量高踞各行业之首,远超紧随其后的电信、保险和能源行业。银行是经营风险 的行业,一方面,监管层对银行机构的风控能力提出很高要求,另一方面,风控直接会影响银行机构的 利润水平。通过对海量数据的有效利用,能够在用户画像、反欺诈、信用评级等方面大大提高银行机构 的效率和风控能力。 提高政府办事效率
9、。 以往,群众找政府办事,需要来回跑多次。通过进行数据共享、数据整合,打 1.2 数据的有效应用正成为经济社会发展的强劲驱动力 工业互联网赋能工业企业转型升级。工业互联网通过人、机、物的全面互联,实现全要素、全产业 链、全价值链的全面连接,对各类数据进行采集、传输、分析并形成智能反馈,推动形成全新的生产制 造和服务体系,优化资源要素配置效率,充分发挥制造装备、工艺和材料的潜能,提高企业生产效率, 创造差异化的产品并提供增值服务。以国家电网公司为例,国家电网公司提出“泛在电力物联网”战 略,把用户、企业、设备、供应商等人和物全部连起来,实现设备和状态的全面感知,通过把数据汇 聚、共享,为用户、电
10、网、供应商等提供数据服务,使数据为社会提供更多价值服务。 以人为本提升社会发展。2017年12月,广东省率先在全国部署“数字政府”改革建设,以数据开放 释放“数字红利”,极大提升政府治理能力现代化水平。基于“数字政府”统一基础设施,以数据为核 心,盘活政府已有数据中心和社会化数据中心资源,通过数据汇聚、数据治理,建设结构合理、质量可 靠的政务“大数据”体系。2018年9月,广东政务服务网正式上线,实现省、市、县、镇、村五级政务 服务事项“应上尽上”、“一网通办”,变“群众跑腿”为“数据跑路”。 04 数据正在成为数字经济发展关键生产资料 GIV2025报告显示,到2025年,全球将产生180Z
11、B数据。新技术的出现持续推动着数据增长与流动。 4K/8K带来数据存储的需求量激增,以及极致稳定的读写高带宽的需求 当前,信息视频化、视频超高清化已经成为全球信息产业发展的大趋势。从技术演进来看,视频己 经从标清、高清进入4K,即将进入8K、AR/VR时代。以广电行业为例,今年3月1日,工业和信息化 部、国家广播电视总局、中央广播电视总台联合发布了超高清视频产业发展行动计划(2019-2022 年),提出坚持“4K先行、兼顾8K”的总体技术路线,到2022年,中国超高清视频产业总体规模将超 过4万亿元。4K超高清的建设和应用,使广电行业IT基础设施在高可靠的基础上,向着高性能、低延 迟、集约化
12、的方向转型,尤其对存储平台的能力带来巨大挑战。4K超高清制播业务所产生的数据量比高 清多出至少4倍以上,制播的各个环节,如视频剪辑、特效合成、渲染、调色、视频输出等,都需要海量 的存储空间以及并发的读写能力。 1.3 新技术持续推动数据爆发增长 破多个部门之间的数据壁垒,来减少人工窗口、缩短审批流程,从而提高办事效率,减少排队等候的情 况,更加便民。 扩大企业生产效率。通过数据有效利用能实现企业各业务环节间的信息高度集成和互联,减少不必 要的资源浪费。以制造业为例,制造业的研发、采购、物流、生产、库存、销售等环节会产生大量的数 据,诸如各工序节拍信息、产品质量信息、发货和收货信息、物料流动信息
13、、客户需求信息、人力资源 需求信息等。通过将企业内部和外部各项数据高度集成和互联,能够消除过度生产浪费、等待时间浪 费、工序浪费、库存浪费、运输浪费、产品缺陷浪费等,降低生产成本,提高生产效率和产品质量,实 现资源优化配置。 提升警务智能化水平。在公安行业建立健全基础数据实时采集、动态更新、高度共享、深度研判的 工作机制,汇集来源于公安、政务、社会的数据资源,并面向公安机关及政府部门提供统一的支撑,实 现数据资源的交换、集成和服务。通过建立一个以视频图像为主、多种资源关联叠加的视频资源智能化 服务体系,打造公安机关视频应用实战的“神兵利器”,全面提升警务智能化水平。 促进经济社会可持续发展。数
14、据的应用有助于推动环保、节能、绿色产业发展,促进环境保护和经 济社会可持续发展。例如,利用大数据可以对环境进行立体监测,通过数据模拟技术和排放清单等工 具,建立环保大数据系统,提高环境监测数据的可靠性,为经济决策提供科学依据。 05 数据正在成为数字经济发展关键生产资料 5G/IoT/车联网带来数据量激增,同时也让数据采集和云边协同能力发生质的变化 5G通过提升连接速率和降低时延,使得单位时间内产生的数据量急剧增长,单位面积内的联网设备 成倍增加,海量原始数据将被收集。4G时代,数据多产生于人与人之间的互联,5G时代,物联网将得 到较大程度的发展,人与物、物与物之间的连接将急剧增多,数据采集渠
15、道将更加丰富,如联网汽车、 可穿戴设备、机器人等,这也对数据存储与采集技术提出更高要求。同时,5G时代下越来越多的IoT设 备将通过边缘计算进行存储、处理和分析,云、边协同能力变得尤为重要。 自动驾驶将产生海量数据,成为新的数据制造机 自动驾驶汽车依赖于安装在车身上的各种传感器传输的大量数据,因此要实现自动驾驶,首先要做 好准备迎接海量数据的“洗礼”。在自动驾驶训练时期,以一辆车的信息采集为例,在进行自动驾驶算 法路测的过程中,每辆汽车每天将产生60TB的训练数据量,仅仅在2017年,该领域就创造了大约 250EB的数据量。2020年前后,自动驾驶汽车将正式上路,每小时将产生4TB的数据,其中
16、包括了关 于道路状况、天气、周围物体、交通和街道标志等的实时信息数据,海量数据存储与处理的时代即将 到来。 AI/大数据将改变数据的存储周期和形态 首先,AI需要更长的数据存储周期。比如,公安部公安机关现场执法视音频记录工作规定明确 提出,现场执法视音频资料的保存期限原则上应当不少于六个月,以构筑“更长证据链”。其次,AI需 要全数据训练、处理和分析。在数据规模化增长的趋势下,可以按温度来定义不同访问频率的数据:经 常被访问的数据称为热数据,而较少被访问的数据称为冷数据,处于中间状态的称为温数据。应用AI之 后,需要数据能在冷、温、热之间随时进行切换。 06 数据正在成为数字经济发展关键生产资
17、料 07 数据应用的现状总结 02 新技术和产业的出现,正在加速企业的数字化转型,大量新的硬件与应用带来数据量快速增长的同 时,也让数据类型越来越多样化。生产、采集和保存尽可能多的数据,用于全量分析以洞察先机,成为 企业的共识。海量数据蕴含巨大的价值,也给存储系统带来了前所未有的挑战,数据存不下、流不动、 用不好成为了各行业数据应用最普遍的难题。 08 创新业务推动企业的数据量从PB级向EB级迈进,根据华为全球产业展望GIV预测,全球新产生 的数据量将从2018年的32.5ZB快速增长到2025年的180ZB。由于存储系统仍为传统架构以及成本等原 因,当前企业数据仅有不到2%被保存,数据“存不
18、下”的问题日益严重。 存储扩展性不足:传统存储由独立的控制器与硬盘框组成,当容量不足时可增加新的硬盘框进行级 联,但由于控制器的处理能力受限,存储的扩展能力非常有限。在政务云建设中,省级平台通常需要规 划至PB级的容量,单套存储已经无法满足需求,因此只能部署数十套高端、中端和低端的设备,导致管 理的复杂和数据的割裂。 存储协议类型单一:非结构化数据逐步成为企业数据的主体。随着电商、物联网等业务扩张,80% 的新增数据由各类音视频、日志等非结构化数据构成。然而传统存储协议类型单一,无法同时满足块、 对象、文件、大数据等多样性数据的存取需求,企业不得不为每一种新的数据类型新增一种存储设备, 增加了
19、高效利用存储资源的难度。 存储成本依然高昂:越来越多的企业选择将数据长期保存。2017年起,移动运营商因合规性要求, 将其设备日志的保存周期从2个月增加至6个月。这意味着其数据存储服务器的设备规模将增加至少2倍。 传统的架构中,服务器因存储需求不断扩容,但CPU的使用率却始终处于较低的状态,资源得不到合理 利用,无疑会对采购成本和维护成本造成更大的压力。企业不得不因为存储成本而放弃大量宝贵数据。 2.1 存不下数字化浪潮下的海量数据存储挑战 孤立的数据价值并不显著,只有当数据像水一样流动起来,才能打破“数据壁垒”,最大化释放其价 值。然而当前企业保存下来的数据,由于技术与流动性问题,只有10%
20、的数据能得到分析,数据孤岛、 多样性设备、业务迁移成为数据“流不动”的主要瓶颈。 2.2 流不动由来已久的数据孤岛难题 数据应用的现状总结 数据的“三类孤岛” 应用孤岛:不同应用产生的数据分别存放在不同的存储系统中,而且这些数据由于各自的特征,彼此 之间是无法共享使用的,即形成“应用孤岛”问题; 管理孤岛: 为对生产数据加以保护和使用,会将生产数据的一个副本,拷贝到各个系统(如备份、 容灾、归档、开发测试和分析系统)中进行管理和使用。即便是同一份数据,为实现不同目的,还需分 别存储、管理和使用,即形成“管理孤岛”问题; 地理孤岛:由于企业的更新换代,将存在多套存储设备,比如生产环境、非生产环境
21、、云环境和边缘 环境,企业的数据将存放在不同的地方,形成“地理孤岛”问题。 资源的“三堵高墙” 产生上述问题的根本原因:企业在建设数据基础设施时,从满足客户的诉求出发并考虑投资成本问 题,会选择不同的计算资源、网络资源和存储资源来分别满足客户的不同诉求。 算力墙: 各个存储系统的CPU能力,仅供本系统使用,无法将算力资源共享使用,形成各存储系统 之间的“算力墙”; 网络墙:各个网络都有各自的协议,彼此之间无法互连互通,即各个网络之间形成“网络墙”; 介质墙:存储介质的性能、容量和成本各不相同,客户会选择合适的介质存储数据,这使得数据分别 存储在不同系统的不同介质中,而且这些数据很难共享访问,即
22、各个存储介质之间形成“介质墙”。 09 海量的数据孕育了前所未有的机遇,也带来了巨大的挑战。甚至有人说,从来不缺数据,数据多了反 而成为一种负担。也有人说,数据只是资源,而不是资产,很难产生价值。其根本原因是没有用好数 据,数据没有释放价值。而影响数据价值释放的主要原因是数据供应不足,无法反馈业务本质,支持业 务决策: 大量数据未存储 企业每天会产生大量数据,但传统的数据录入需要预先的人工规划,这导致大量非结构化数据以及 一些新型的数据无法进入系统(例如IoT数据、视频数据、图片数据等)。数据的缺失会削弱对业务的感 2.3 用不好数据供应不足造成应用复杂低效 数据应用的现状总结 10 知,无法
23、真实及时地反映出业务本质。 找不到数据 传统企业通常通过数据表来管理和分析数据,规模较大的公司数据表甚至可以达到数百万张,而且 分散在各个业务系统中。如果没有统一数据目录和全局数据视图,要在上百万张报表中找到特定的数 据,好比大海捞针,无法应对灵活多变的业务需求。 谁对数据负责 在大数据时代,一个典型的分析业务通常需要跨平台的数据协同。如果已经接入的数据无法满足分析 需求,需要从前端多个业务系统获取新的数据,再加上缺乏统一的隐私与安全共享机制,数据就需要经 过多部门间协调、拉通、核实才能获得。数据分析的链路冗长,一旦出现问题,就需要“六方会谈”才 能定位,无法保证数据供应稳定和高可用,更无法实



- 温馨提示:
建议用WPS软件(.pptx、.docx)打开文档,少量文档使用Microsoft(.ppt、.doc)打开易出错。
- 配套讲稿:
如PPT文件的首页显示word图标打开文档,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 基础设施 白皮书
