税务大数据平台总体规划建设方案.pptx
《税务大数据平台总体规划建设方案.pptx》由会员分享,可在线阅读,更多相关《税务大数据平台总体规划建设方案.pptx(50页珍藏版)》请在悟道方案网上搜索。
1、税务大数据平台总体规划建设方案,目录,2税务大数据解决方案,税务大数据背景及规划,1,3,大数据产品介绍,2,2019年XX税务ZJ筹建税收大数据和风险管理办公 室,形成了全国上下联动的大数据和风险管理机构。 XX税务ZJ大数据管理咨询项目:对未来税务数据和 风险管理体系进行总体设计,进一步明确发展目标,对 数据管理机制、风险管理机制提出建设意见,推进数据 应用创新,为未来大数据和风险管理体系建设提供蓝图 和路径。 充分发挥大数据在税收征管中的作用,全面实施大数据 战略,明确税务ZJ大数据和风险管理体系框架,提升 大数据和风险管理能力,推进税收治理体系和治理能力 现代化。 XX税务ZJ局长WJ
2、多次提出,深化税收数据应用, 充分挖掘和发挥税收大数据金山银库的效应。 近日,提出运用税收大数据,服务全局要尽力,通过 税收大数据建设的不断推进,为税务部门加强大数据 管理、深化数据应用提供了有力支撑。,成立大数据与风险管理局,构建现代化大数据和风险管理体系,省 局,总 局,电子税务管 理中心,XX税务ZJ/局长,征管和科技 发展司,副局长 主管信息化,大数据与风 险管理局,副局长主管采购等,采购中心,信息处,XX税务ZJ/局长,征管和科技 发展处,大数据与风 险管理局,副局长 主管信息化副局长主管采购等,采购处,3,税务大数据应用发展趋势:全量、实时、智能、精准,金税一期 1994 - 19
3、96,金税二期 1998 - 2013,金税三期 &“互联网+” 2013 - 2020,业务报表,收入核算,2 3,4,发票,出口退税 稽查,风险纳税人定期计算、 定期推送 事前 申报、征收,风险事件事中提示、 快速阻断 事中,明确事后应对的风 险事件 事后,风险 管理,纳税 信用,1,离散到全量数据 全业务领域覆盖,全业务流程打通,收集全部关联数据 周期到实时转变 按月、季度报表分析,变为实时展示、实时分析 人工到智能转变 通过机器学习提升纳税人行业划分、建立防增值税专用发 票暴力虚开等算法模型。 粗放到精细转变 按行业、地域、业务分析,变为以纳税人为核心精确画像,4,税务大数据,
4、数 据 源,数 据 应 用,运营运维,数据汇聚,数据管理,数据服务,数据割裂,外部数据整合不足, 智能化应用不足,批量数据汇聚,无法满足实时数据 汇聚业务需要; 纳税人相关数据分散在各个模块的 不同数据表里,没有整合和关联 政府其他部门数据和互联网第三方 数据整合不足,缺乏统一治理,数据资产不清, 质量不高,在数据治理工具、数据治理专业服 务和数据服务能力上不足 缺失可视化的基础数据资产管理, 无法支撑数据血缘关系管理、业务 建模和数据可视化分析,数据获取效率低,数据冗余、 查询效率低,业务部门在进行数据分析时,获取 数据的方式比较原始,通常需要编 写脚本到数据库中查询或是通过金 三系统前台页
5、面多次查询数据 缺乏数据和分析工具,不能充分释 放出基层的业务创新的潜力,运营运维体系不健全,运营挑 战大,数据应用、数据管控等的管理办法、 管理流程、管理规范(技术和业务 规范),有缺失 各地运维运营团队缺失,无法有效 支撑平台运营工作,税务大数据现状和挑战,5,规划统一智能数据平台,驱动税务数字化转型,用户渠道层,应用层,应用支撑平台,统一智能数据平台,基础资源层,外部第三方数据,渠道体验一致化 在不同渠道的应用体验一致且连续,业务创新敏捷化 基于平台、框架和能力,实现创新快速落地,事项办理一站化 地方特色业务、创新业务与ZJ业务全面集成 税务人通过统一登陆门户访问各个内部系统,业务应用融
6、合化 遵循“核心微业务”理念,实现业务短链化 支持“信用 + 风险”体系,对接ZJ建设理念,数据交换归一化 外部数据获取渠道“三合一” 对外推送信息渠道唯一化,6,基础架构集约化 整合现有资源搭建私有云引入公有云,数据驱动能力 精益化 建设智能数据平台基座 完善的数据治理体系 引入人工智能开发平台 提供可视化分析工具,数据应用智能化 智能业务智能指挥 智能分析智能风控,智能纳服 智能稽查,目录,税务大数据背景及规划,1,税务大数据解决方案 大数据产品介绍,7,税务整体数据架构,实现智能数据驱动业务发展,数 据 源,智 能 数 据 平 台,数据治理,数据分析工具,数据服务,数据加工流计算 及存储
7、文件存储,批处理 数据仓库,对象存储 图数据库,人工智能工具,AI开发平台,数据标准 管理,数据质量 管理,数据资产 管理,数据组织与 职责,数据制度与 流程,数据交换平台,税务内部数据,互联网及其他 第三方数据,其他相关部门数据,企业纳税人数据,应,AI算法模型,第三方算法,1.数据汇聚 统一税务局和其他政府部门的数据采集交换平台 提升数据接入场景能力,提供批量、实时、流式多种 数据集成方式 建立第三方数据采集通道和管理规范 2.存储计算 提供多种类型存储计算,满足批量计算、流计算、交 互式查询、实时检索等多种计算场景; 3.数据治理体系 建设一体化数据治理工具体系 优化数据管理组织与职责,
8、梳理数据资产,建立数据 资产管理机制,明确数据标准落地执行机制 建设数据质量管理体系,持续加强数据治理 4.统一分析工具 提供自助式BI分析和标签工具,数据潜能快速释放; 提供一站式人工智能平台,助力税务智能化转型; 5.统一数据服务 统一数据服务管控,提供工具服务以及数据服务,实 现数据快速变现;,建设内容,8,数据 底座,整合层,帖源层,标签画像,发票管理,户籍档案,集市层,指挥决策主题,专题应用主题,核心征管,电子底账,稽查,行政管理,申报征收,风控应用主题,出口退税,税收优惠,稽查主题应用,标准层,登记,申报,票证,认定,优惠,数据治理,汇聚存储,数据分析,数据服务,应用场景,9,税务
9、数据采集与交换架构图,数据汇聚存储整体方案,数据 汇聚,离线任务,实时检索计算 在线查询,实时流计算 实时任务,HBase,Elasticsearch,离线任务计算,Hive,Spark SQL,RedisFlink,数据存储,交互查询/ 多维分析,交互查询 DLI,在线分析在线查询离线查询数据分析,信息碰撞综合查询,综合查询综合查询,统一数据服务层,数据库,流式数据,文件数据,源系统,存储 计算,数据 应用,数据 服务,MPP,数据治理,汇聚存储,数据分析,数据服务,应用场景,1、混搭架构: 提供MRS(Hadoop平台)+DWS(MPP), 满足离线、实时检索、交互查询、流式计算等 多种计
10、算场景; 2、统一管理:,支数据汇聚以及存储计算组件统一管理和服务, 实现故障快速定位;所有组件全流程调度功能;,3、扩展性: MRS(Hadoop平台)+DWS(MPP) 支持弹性扩展,性能弹性扩容; 4、高性能: 采用分布式架构,提供结构化数据的极致的交 互性能,满足多维关联查询实时分析需要; 5、多场景 支持税务内部等主流场景的批量、实时数 据汇聚,统一存储;,方案特点,MRS(Hadoop),DWS (MPP),批量数据汇聚 DAYU-CDM,实时数据汇聚 DRS/DIS,IOT数据集成 ROMA link,10,1、核心是让数据形成数据资产,,易懂、易用,让数据真正用起来;,2、有效
11、解决数据质量问题,提 升数据质量; 3、提供相应的技术方案和数据 管理平台工具; 4、提供专业化的服务,实现对,数据的有效管理,提升数据质量,,建立数据共享机制。 5、建立和完善数据管控的组织 架构、制度和流程;,数据治理,汇聚存储,数据分析,数据服务,应用场景,数据资产分析,数据资产使用,数据流,数据资产服务,1 元数据,元数据采集,自动采集管理 手工采集管理,元数据视图,元数据存储,元数据质量管理,元数据一致性检查 元数据属性检查 元数据关系健全性,管理视图 视图授权 元数据影响分析,元数据管理 元数据维护 元数据查询 元素据变更 元数据关系维护,数据标准管理,数据标准落地 及映射,数据标
12、准监控,系统模型引用标准 标准映射管理 系统落标参考,标准定义 标准发布 版本管理 标准导出,标准检核规则 变更影响分析 标准落地评估,2数据质量3数据标准,4数据模型,标准引用,版本管理,模型查询,模型管理,6 数 据 生 命 周 期,综合应用 7及服务,元模型,元模型结构管理 元模型维护管理 元模型关系管理,元数据分析,元数据地图 元数据血缘分析 元数据影响分析,定位和分布、影响分析、血 统分析、比对分析、关联 度分析,数据质量考核、质量问题定位 数标落地、标准归集制定、 数据申请,数据资产自动化采集 数据资产流向关系自动化整合 数据资产关联关系整合,数据资产目录、数据自服务,
13、元数据实体存储、元数据关 系存储(流向关系、关联 关系、组合关系),产,服数,务据,层资,资,集数,中据,层产,标准与规范,常态与专项工作,数据治理方案框架 数据可用数据质量,数据安全,资产工作机制,8组织与职责制度与流程,产,机数,制据,层资,产,资数,源据,层资,解决方案,11,大数据平台,数据分析,数据挖掘,数据接口,数据使用,元数据,数据,如何快速识别数据?,如何自动化管理?,如何快速找到样例数据?,我的数据都在哪里?,数据的业务特点是?,我该找谁要数据?,建议: 1. 自动化获取元数据信息 通过自动化采集与解析手段,建立技术、业,务、过程元数据的注册输入,标明数据方位。,2.标明数据
14、方位,整理业务属性 将数据资产按业务属性编目,梳理数据的属 性、共享方式、特性、映射。 3、建立业务数据服务目录 以数据资产为驱动方式,实现数据集成和共 享。建立数据服务目录。,数据资产模型,元 元模型,元模型,汇聚存储数据治理数据分析 关键特性一:建好数据管理体系,快速识别数据,形成数据资产,数据服务,应用场景,12,数据源头监控 针对调度监控和数 据源相关监控过程中 的数据进行整合形成 数据源头调度监控的 分析报表。,数据波动监控 数据抖动监控是 指通过对数据记录数 的监控,在一段时间 周期内,通过折线图 的方式可以查询一段 时间内数据的峰值和 低谷。,及时性监控 数据文件及时性监 控是指
15、通过对要采集 到大数据平台的内部 或外部文件进行存在 性和按时到达性的监 控手段。,一致性监控 数据一致性监控是 对采集时的数据记录 条数和入库的数据条 数进行一致性比对, 对不一致的数据采集 作业进行标记的一种 监控。,20,25,30,35,40,45,每日数据变化量检测,日 使 用 流 量,(MB),6月,7月,数据不一致怎么办?,数据量异常波动?,数据源变更怎么办?,建议: 明确重要监控指标 梳理数据平台、MPP、 Hadoop平台的重要数据监 控指标与监控需求。 建立多渠道监控方式 对接数据监控平台,以以邮 件、短信等通知方式告警。,汇聚存储数据治理 关键特性二:提供专业的数据监控体
16、系,快速发现问题,数据分析,数据服务,应用场景,13,元数据采集,收集数据业务含 义,整合元数据, 形成数据信息项,元数据整合,实现自动化的元数 据采集,摸清大数 据资源状况,元数据目录,基于数据特征形 成大数据资源索 引目录,元数据服务,元数据协同,跨部门数据共享协 作,通过技术元数 据与业务元数据的 对接避免数据不一 致和数据开发返工,生产库,前置库,HiveHbaseMPP,元数据 自动采集,技术特性 缺失数据,开发规范,设 计规范缺失,调研 收集 整合,数据来源目录,数据存储目录,数据要素目录,数据专题目录,自主的数据准备, 快速整合多元数据, 形成服务数据,数据分析工作簿,工作簿详情
17、,数据服务,业务部门,业务部门,元数据 协同,汇聚存储数据治理 通过元数据采集,快速形成数据资产,摸清数据资源状况,数据分析,数据服务,应用场景,14,数据服务平台:数据服务目录,数据服务平台:服务目录技术视图,数据资产目录产品展示 数据服务平台:服务目录业务视图,数据治理,汇聚存储,数据分析,数据服务,应用场景,15,数据治理,汇聚存储,数据分析,数据服务,应用场景,16,数据质量提升方法和过程,数据质量提升核心步骤: 1数据质量标准制定及源头保证:税务局 各业务部门制定明确的各类数据标准及数据 质量管理要求,将相关标准及要求固化到数 据源头系统中。 .数据质量问题收集、分析及解决方案制 定
18、:由业务部门对现有数据质量问题进行广 泛收集与分析,并由大风局配合业务部门将 数据质量问题分类,明确实际质量问题。 3数据质量提升方案执行:大风局协同业 务部门和征科针对不同数据质量问题的解决 方法制定详细解决方案,并共同落实执行相 关方案解决现有数据质量问题。,数据源,数据源,数据仓库,应用,应用,ODS层,DW层,DM层,稽核规则配置,元数据对象管理 资源 表 视图,空值校验,重复校验,格式校验,参照校验,波动校验,逻辑校验,一致性校验,自定义校验,关系校 验,规则翻译,规则执行,BDI流 程 调 度,稽核结果,稽核 监控,稽核问题管理,稽核异常工单,数据质量报告 (日报、月报),自定义表
19、单,流程设置,BPM流程管理,稽核工单 配置,采集,服务,加工,加工,稽核,稽核,稽核,质管处,审批人,数据质量平台实现数据仓库数据 处理全过程的质量监控与质量稽 核,规避数据问题,提高数据质 量,让数据变得更好。 全图形化配置界面,简化稽核 操作和配置 针对异常问题,自动生成工 单,实现稽核问题的流程化管 理 建立数据质量考评制度,综合 评估数据稽核及问题处理结 果,定期生成数据质量评估报 告,数据处理全过程的质量稽核,有效保证数据质量,数据治理,汇聚存储,数据分析,数据服务,应用场景,17,数据地图是元数据信息的全景视图,描述所有元数据对象的血缘关系,所处层级覆盖范围由归集库-中心库- 基
20、础库-主题库。全面呈现了数据库中不同数据层级之间的关联关系,数据分类归属,数据关系一目了然。,汇聚存储数据治理 元数据管理,形成数据地图,快速定位数据变更影响分析,数据分析,数据服务,应用场景,元数据管理,数据标准管理,数据模型管理,数据质量管理,主数据管理,数据安全管理,数据运营,数据资产管理,DATA,大数据探索稽查,大数据标准制定,一站式工具,数据标准,标准和数据实时对比、分析和稽查,达到高度统一; 元数据,完整记录数据处理链路血缘关系,形成全局数据地图; 数据质量,自动化稽核任务执行、质量监控,完整质量报告; 数据建模,可视化的模型设计、模型管理和模型监控;,全流程服务,治理筹备,目标
21、筹划、业务调研、数据摸底; 治理规划,组织规划、流程规划、机制建设; 治理过程,数据汇聚、数据标准化、数据稽核、质量评估; 治理服务,标准设计、稽核规则设计、模型设计、资源库设计;,提供一站式工具和全流程服务,数据治理,汇聚存储,数据分析,数据服务,应用场景,19,数据治理,汇聚存储,数据分析,数据服务,应用场景,敏 捷,BI,报表报告 Excel电子表格 Office分析报告 数据填报审批,数据可视化 图形可视化 GIS地图分析 交互式仪表盘(大屏),自助探索分析 即席查询 OLAP多维分析 自助式仪表盘,移动协同 移动APP 协同决策,格式多变的报表,基于地图自助分析,图形类型自助分析,大
22、屏自助可视化分析,大数据平台,业务系统数据,数据源,训练平台服务,推理平台服务,人 工 智 能,视频图像 识别场景,语音语义 类AI场景,预测类 AI场景,标签目录管理,标签生命周期管理,数 据 标 签,标签创建,标签更新,标签服务,宽 表 配 置 与 维 护,深度 挖掘,数据获取数据获取宽表存储,数据分析平台,调用算法,返回结果,自助式创建数据集,分析展现,分析展现,自助式分析,敏捷BI,多种展示方式,简单易用的数据查询和分析系统; 数据标签,提供数据标签模型管理和标签全生命周期管理; 人工智能,一站式AI开发平台,可以完成复杂的数据分析;,20,自助式,业务人员创建分析应用,实现自己的分析
- 温馨提示:
建议用WPS软件(.pptx、.docx)打开文档,少量文档使用Microsoft(.ppt、.doc)打开易出错。
- 配套讲稿:
如PPT文件的首页显示word图标打开文档,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 税务 数据 平台 总体规划 建设 方案