欢迎来到悟道方案网! | 帮助中心 悟道方案,精品价值!
悟道方案网
全部分类
  • AI智慧城市方案>
  • AI智慧建造方案>
  • AI大数据方案>
  • AI智能制造方案>
  • AI弱电智能方案>
  • 报告技术规范>
  • 技术文档清单>
  • ImageVerifierCode 换一换
    首页 悟道方案网 > 资源分类 > DOCX文档下载
     

    银行数据仓库系统技术方案V2.8.docx

    • 资源ID:5526       资源大小:1.63MB        全文页数:46页
    • 资源格式: DOCX        下载积分:168金币
    微信登录下载
    会员登录下载
    三方登录下载: 支付宝登录   QQ登录   微博登录  
    二维码
    微信扫一扫登录
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    银行数据仓库系统技术方案V2.8.docx

    <p>银行数据仓库系统技术方案 V2.8 &nbsp;银行 数据仓库系统 技术 方案 &nbsp;银行数据仓库系统技术方案 V2.8 &nbsp;目 &nbsp;录 &nbsp;第一章 系统总体架构 . &nbsp;1.1 总体架构设计概述 &nbsp; &nbsp;1.1.1 总体架构的设计框架 &nbsp; &nbsp;1.1.2 总体架构的设计原则 &nbsp; &nbsp;1.1.3 总体架构的设计特点 &nbsp; &nbsp;1.2 EDW 执行架构 &nbsp; &nbsp;1.2.1 执行架构概述 &nbsp; &nbsp;1.2.2 执行架构设计原则 . &nbsp;1.2.3 执行架构框架 &nbsp; &nbsp;1.3 EDW 逻辑架构 . &nbsp;1.3.1 逻辑架构框架 . &nbsp;1.3.2 数据处理流程 . &nbsp;1.4 EDW 运维架构 . &nbsp;1.4.1 运维架构概述 . &nbsp;1.4.2 运维架构的逻辑框架 . &nbsp;1.5 EDW 数据架构 . &nbsp;1.5.1 数据架构设计原则 &nbsp; &nbsp;1.5.2 数据架构分层设计 &nbsp; &nbsp;1.6 EDW 应用架构 . &nbsp;1.6.1 应用架构设计原则 &nbsp; &nbsp;1.6.2 数据服务 &nbsp; &nbsp;1.6.3 应用服务 &nbsp; &nbsp;第二章 ETL 体系建设 &nbsp; &nbsp;2.1 ETL 架构概述 . &nbsp;2.2 ETL 设计方案 . &nbsp;银行数据仓库系统技术方案 V2.8 &nbsp;2.3 ETL 关键设计环节 &nbsp; &nbsp;2.3.1 接口层设计策略 &nbsp; &nbsp;2.3.2 Staging Area 设计策略 &nbsp; &nbsp;2.3.3 数据加载策略 . &nbsp;2.3.4 增量 ETL 设计策略 &nbsp; &nbsp;2.3.5 异常处理 &nbsp; &nbsp;2.3.6 作业调度和监控 &nbsp; &nbsp;2.3.7 元数据管理 . &nbsp;2.3.8 ETL 模块设计 &nbsp; &nbsp;2.3.9 ETL 流程设计 &nbsp; &nbsp;2.3.10 动态资源分配 . &nbsp;2.3.11 数据接口设计 . &nbsp;银行数据仓库系统技术方案 V2.8 &nbsp;第一章 系统 总体架构 &nbsp;1.1 总体架构设计概述 &nbsp;1.1.1 总体架构的设计框架 &nbsp;XX 银行 EDW 项目的总体架构 分为基础技术架构、应用架构和数据架构三个 核心部分。这三个部分共同组成了 XX 银行 EDW 系统。 &nbsp;在基础技术架构中,包括执行架构、逻辑架构、功能组件架构和运维架构四 个部分。 &nbsp; 执行架构描述系统大的框架和模块区域,以及之间的逻辑关系;是确定 生产环境的建设要求及指导原则。 &nbsp; 逻辑架构描述 EDW 各个模块之间的数据的接口、数据流向、工具使用和 采用具体的技术实现手段或方式情况,用于规范本项目最终生产环境的 建立。逻辑架构是建立应用架构、执行架构、运维架构的基础,也是建 立执行架构、应用架构以及运维架构的原型系统。 &nbsp; 功能组件架构描述 确定系统各个大的组件组件区域的功能模块框架,以 及提供的某种服务类型。 &nbsp; 运维架构是描述 EDW 项目的运维架构标准,包括运维架构设计的内容、 设计原则、各构成组件的设计考虑因素、约束、要求等。运维架构通过 相应的流程和工具实现对逻辑架构、功能组件架构、执行架构、数据架 构以及应用架构的运维和管理。 &nbsp;而数据架构和应用架构的主要描述: &nbsp; 应用架构是 EDW 为满足业务需求所提供的系统应用功能及其蓝图设计, 其中业务需求是应用架构设计的基础,最终的应用架构将以应用系统的 形式体现在执行架构中,主要包括:应用服务和数据服务。 &nbsp; 数据架构描 述于 EDW 系统相关的数据流动策略,即数据在 EDW 系统的执 行架构下的抽取、转换、储存策略以及应采用的流程,包括数据层次和 总分行之间的数据分部情况等。数据架构是建立执行架构标准的需求定 银行数据仓库系统技术方案 V2.8 &nbsp;义。 &nbsp;下图是 EDW 项目总体架构的框架: &nbsp;1.1.2 总体架构的设计原则 &nbsp; 总体架构在着重考虑实施要求的同时,需要为后续阶段进行规划,以保 证项目最终能够达到目标架构的设计; &nbsp; 总体架构的设计要基于包括 XX 银行数据现状分析、实施阶段数据源情 况分析、第一阶段实施 EDW 设计建议做为参考; &nbsp; 总体架构设计架构时充分考虑与现有系统兼容,充分利用已有成果,避 免重复开发和建设。 &nbsp; 总体架构设计过程中应遵守 XX 银行的 IT 管理规程,保证最终的系统可 以顺利的部署并移交给 XX 银行 的运行维护部门 。 &nbsp;1.1.3 总体架构的设计特点 &nbsp; 权衡功能、性能、可扩展性、易用性、可管理性 和性价比 。 &nbsp; 根据 XX 银行 的数据情况和分析需求,采用多层次的企业 EDW 系统 架构来 银行数据仓库系统技术方案 V2.8 &nbsp;保证在存在复杂的数据种类和关系的海量数据上进行业务分析和查询 在业务支持能力和性能等方面的要求。 &nbsp; 多级自动的增量 ETL 加载机制,有效提高 ETL 并发度、加载效率,降 低错误处理的复杂 性。 &nbsp; 通过用户入口支持用户采用 Web 浏览器使用查询和分析工具,统一的信 息服务界面,提高系统易用性,减少技术支持工作量。 &nbsp; 利用企业信息集成和 Web 数据服务,提高系统的数据支持能力和接口的 一致性。统一的数据增强平台也减少数据增强的复杂度。 &nbsp;1.2 EDW 执行架构 &nbsp;执行架构的主要内容是描述 EDW 项目执行架构的建设要求及指导原则,用 于规范本项目最终生产环境的建设。 EDW 项目的生产环境的建立需要参考并遵循 执行架构部分提出的要求。 &nbsp;1.2.1 执行架构概述 &nbsp;执行架构是 EDW 的概念环境,主要包含:源数据、数据落地区、 ETL、数据 准备区、数据 存储区 EDW、业务应用、用户环境、数据管控、系统安全性以及 EDW 基础设施平台(包括:服务器、存储、网络)等功能组件。从技术层面上来说, EDW 系统的执行架构应实现多种技术平台及应用之间的无缝集成。 &nbsp;1.2.2 执行架构设计原则 &nbsp;在 EDW 项目实施的过程中,系统执行架构的建设应遵循以下技术原则: &nbsp; 开放性原则 : EDW 项目的生产环境的建设应基于业界开放标准,对系统 中使用的网络协议、硬件接口、数据接口等应进行统一规划, EDW 系统 应支持主流的应用软件包及其部署的各种硬件平台。 &nbsp; 灵活性与可扩展性 : EDW 系统的基础设施平台应能够根据未来 系统的发 展需要以及应用需求,方便的扩展设备容量和提升设备性能;具备支持 多种组件模块、多种物理接口的能力;具备技术升级、设备更新的灵活 性;具备支持业务功能的扩展与重构的灵活性。如:系统容量可以随着 银行数据仓库系统技术方案 V2.8 &nbsp;ETL 系统数据量的扩展以及应用系统的不断扩展、用户量不断扩展而进 行平滑的扩展。 &nbsp; 高性能原则 :系统应达到数据处理时间窗口的要求,用户定义的查询效 率、响应时间的要求,满足业务系统的要求;对现有业务系统影响小。 &nbsp; 自动化原则 : EDW 项目建设的核心任务之一是数据抽取、转换、清洗和 加载( ETL),在这个过程中应采用自动化的设计原 则,避免手工操作。 同时对于元数据管理过程应采用元数据管理平台来实现对元数据集中、 自动化的管理。 &nbsp; 安全性原则 : EDW 项目建设中的数据迁移过程都必须保证数据的安全性, 例如:在系统建设过程中应对数据中敏感字段进行安全处理、同时整个 系统还应采用网络隔离、用户身份认证及访问控制、数据库安全、操作 系统安全以及完善的安全审计机制。 &nbsp;1.2.3 执行架构框架 &nbsp;业 务 数 据 源 E T L 数 据 抽 取 转 换 加 载 数 据 准 备 区 操 作 型 存 储 业 务 应 用 E T L 数 据 抽 取 转 换 加 载 元 数 据 管 理 系 统 安 全 基 础 设 施 平 台 ( 服 务 器 、 网 络 、 存 储 ) 数 据 落 地 区 数 据 落 地 区 渠 道 系 统 核 心 系 统 其 他 系 统 分 析 环 境 报 表 环 境 应 用 环 境 操 作 型 数 据 / 标 准 化 数 据 用 户 环 境 E T L 数 据 抽 取 转 换 加 载 报 表 / K P I 灵 活 查 询 其 他 集 市 数 据 准 备 区 对 公 信 贷 个 贷 系 统 国 结 系 统 人 力 系 统 E D W 数 据 仓 库 ( E D W ) 企 业 级 数 据 模 型 财 务 系 统 数 据 分 发 环 境 报 表 分 发 环 境 通 用 展 现 平 台 上图是 EDW 系统执行架构,其中包含 EDW 系统中涵盖的功能框架以及框架之间的 逻辑关系。在以下的内容中将对执行架构中的功能框架以及框架之间的关系进行 详细描述,具体内容包括: &nbsp;银行数据仓库系统技术方案 V2.8 &nbsp; 数据源: 包括 XX 银行的多个业务系统,主要有核心系统、个贷系统、信贷 系统、国际业务系统、财务系统和各类渠道系统等。 &nbsp; 数据落地区 :此部分内容说明数据落地的用途,同时对数据落地区应具备的 功能进行了标准定义以及数据落地区与其他功能组件之间的关联关系; &nbsp; ETL:此部分内容描述 ETL 系统中数据抽取、转换、加载等功能的需求,同 时定义了 ETL 系统建设的标准 以及 ETL 与系统中其他功能组件之间的关系; &nbsp; 数据准备区 :此部分描述数据准备区应具备的功能,以及数据准备区在建设 过程中的标准需求。 &nbsp; 操作型存储区 :此部分内容描述 EDW 系统在建设的过程中操作型存储区应遵 循的标准以及系统建设过程中应满足的需求; &nbsp; 数据仓库存储区 :此部分内容描述 EDW 系统的数据仓库存储区应遵循的标准 以及系统建设过程中应满足的需求; &nbsp; 业务应用 :此部分内容描述 BI 应用系统建设的系统需求,包含对应用环境、 分析环境、静态报表环境; &nbsp; 用户环境 :此部分的内容描述用户在 EDW 系统中应具备运用的能力,包括: 利用通用 展现平台进行信息展现、驾驶舱应用、报表应用等; &nbsp; 时间窗口和性能的定义 :此部分描述整个 EDW 项目中关于时间窗口的定义以 及相关系统的性能指标要求; &nbsp; 元数据管理 :此部分描述在系统执行架构中元数据管理的内容以及元数据管 理系统的建设的标准定义; &nbsp; 系统安全性 :此部分内容主要描述 EDW 系统中的安全性管理内容,包括应用 安全、网络安全、数据安全、系统安全等,同时描述系统安全在建立过程中 遵循的原则; &nbsp; 基础设施平台 (服务器 、网络、存储):此部分内容主要描述生产系统中的 硬件资源,包括:服务器,网络以及存储的资源需求,容量规划应满 足的系 统指标等内容; &nbsp;银行数据仓库系统技术方案 V2.8 &nbsp;1.2.3.1 数据源 &nbsp;源数据系统是报表、关键指标、灵活查询、主题分析等应用系统的基础数据 来源。在系统建设初期,源数据系统应提供能满足初始业务需要的数据以及业务 系统需要提供完整数据的时间窗口,在 EDW 系统扩展的过程中,各个源数据系统 中的数据将逐渐的加载到 EDW 系统当中。源数据无法满足应用需求时,系统应提 供手工方式通过手工数据补入平台将需要的数据补入到 EDW 系统中。 &nbsp;目前数据源包括 XX 银行的多个业务系统,主要有核心系统、个贷系统、对 公信贷系统、国际业务系统、财务系统和各类渠道系统等。 &nbsp;1.2.3.2 数据落地区 &nbsp;数据落 地区是为了保证多系统对源系统数据抽取的需求,在数据从源数据系 统抽取后在统一的数据集成环境中整合。数据落地区应建立与各相关源数据系统 的接口,将这些系统定期卸载的数据以固定的格式接收、存放到落地区,考虑数 据传输和加载的速度,源数据系统应以文本文件格式将数据定期传输给数据落地 区进行处理。 &nbsp;数据落地区的数据存储格式原则上是与数据源的存储格式保持一致 &nbsp;1.2.3.3 数据 ETL架构 &nbsp;ETL 是数据的抽取、转换、加载的全部过程,它是数据从数据落地区到 ETL 服务器以及从 ETL服务器到 EDW的数据迁移过程以及数据从 EDW向数据集市的数 据迁移 过程中必须使用的过程和方法, ETL 系统应包括以下三个主要功能: &nbsp; 数据抽取 :从数据落地区系统抽取 EDW 中需要的数据; &nbsp; 数据转换 :将从源数据系统获取的数据转换成 EDW 要求的形式,同时按 照业务需求对数据进行转换; &nbsp; 数据加载 :将助转换后的数据装载到 EDW 的物理模型中; &nbsp;1.2.3.4 数据准备区 &nbsp;数据准备区是数据存储的临时存储区域,数据在其中只作暂时性保存,数据 经转换后导入到 EDW 的物理模型中。 &nbsp;数据准备区的功能包括:格式转换、排序去重 /筛选、通用基础清洗、连接 / 银行数据仓库系统技术方案 V2.8 &nbsp;合并 /分割、业务转换等 &nbsp;1.2.3.5 操作型存储区 &nbsp;操作型存储区是数据仓库系统一个重要的环节。该区有着承上启下的作用, 从数据形态来看,该区的数据定义贴近业务源系统 ;从数据标准来看,该区的数 据标准是遵循数据仓库系统的标准。所以该区一般分为两个层次,第一个层次称 之为良好质量的、统一格式的数据贴源层,第二个层次为统一的、规范的、遵循 数据仓库系统标准的数据标准层。 &nbsp;数据贴源层可以继续为行内现有的一些报表系统或者分析系统提供数据, 而数据标准层为数据仓库中的企业数据模型的落地扫清了道路。 &nbsp;所以该存储区在整个 EDW 系统起到了一个承上启下的关键作用。 &nbsp;1.2.3.6 EDW存储区 &nbsp;EDW 存储区是面向主题的、集成的、面向企业的、最明细的数据存储,其内 容是依据最终用户应用和分析需求来进行组织。数据存储区中的数据模型对标准 层数据、基础整合数据、汇总数据和面向应用的集市数据按数据层次进行管理, 每个数据层有自己的数据管理重点。对于每个数据层次,再按主题进行分类组织。 这样就可以有效的将银行企业的操作型数据、汇总型数据和分析型数据以清晰的 架构组织、管理起来,并相辅相成。数据层的内容相互促进发展,组成银行完善 的数据集合,为各种主题管理应用的构建提供良好的数据架构基础。 &nbsp;1.2.3.7 业务应用 &nbsp;业务应用是 EDW 系统向业务用户提供应用功能支持,根据应用服务提供的形 式和所采用的应用系统的不同,业务应用主要定义在以下几个技术环境。 &nbsp;数据集市 :在业务应用层中包含了应用系统中需要的应用集市、 OLAP、静态 报表等数据集市。数据集市是一组特定的、针对某个主题域、部门或用户分类的 数据集合。这些数据需要针对用户的快速访问和数据输出进行优化,优化的方式 可以通过对数据结构进行汇总和索引。通过数据集市可以保障 EDW 的高可用性、 可扩展性和高性能。 &nbsp;应用环境 :应用环境是为满足业务需要在数据 EDW 环境中配置的应用软件包。 &nbsp;分析 环境 :数据分析环境为 EDW 的高端用户提供即时的数据分析功能等。 &nbsp;报表环境 :报表环境是于来产生和发布静态报表的环境,包括:产生的静态 银行数据仓库系统技术方案 V2.8 &nbsp;报表、 OLAP 产生的报表、 KPI 指标展现以及其他系统产生的报表。 &nbsp;1.2.3.8 用户环境 &nbsp;用户环境是 EDW 系统最终向用户提供的某种应用服务的集合,主要有三种应 用服务的表现形式: &nbsp;通用展现平台: 通过此平台将报表、 KPI 展现、灵活查询、分析等多个应用 集成到一个平台中,进行统一的展现和信息的管理,包括如:报表生命周期的管 理等。 &nbsp;数据分发环境 :在数据分发的过程中应提供大容量数据批量分发的能力。给 其他需 要某个系统的数据提供数据交换功能。 &nbsp;报表分发环境: 报表的分发应可以满足系统定义的安全性,如按照不同的用 户类型、不同的组织进行分发,不同的用户和组织只能看到属于自己的报表的数 据,数据的分发将通过数据传输平台进行。 &nbsp;1.2.3.9 元数据管理 &nbsp;元数据管理是对数据信息的收集和发布的集成管理,数据信息包括:数据的 业务含义和技术特性。数据仓库系统架构中的各个部分中都含有元数据信息,应 对其进行主动式管理,以保证它正确的定义、收集和使用。元数据是“关于数据 的数据”。应包括文件结构定义,数据库字段名称,数据模型中的长度和标准, 以及在域 -域 或域 -报表对应关系中的计算和公式等内容。 &nbsp;元数据管理的架构如下图所示,系统的最终架构应实现对元数据的集中的管 理方式: &nbsp;银行数据仓库系统技术方案 V2.8 &nbsp;1.2.3.10 系统安全性 &nbsp;EDW 系统中的数据和报表信息均为敏感信息。因此必须采用适当的安全策略 以保证其系统和数据的安全性。数据仓库系统的安全性应涵盖如下四个方面: &nbsp; 验证 :系统应对用户进行访问控制,保证只有合法的用户才能进入到系 统中; &nbsp; 授权 :系统应根据用户角色对其进行授权,包括对数据的访问权限,对 功能的使用权限等。 &nbsp; 机密性 :所有的敏感数据必须被严格控制,禁止未授权访问,并保障其 安全性。 &nbsp; 一致性 :数据和程序只能在授权模式下进行修改。 &nbsp;针对上述 6个方面,数据仓库分系统应按照以下的 6个方面的标准进行建设: &nbsp;应用层 &nbsp;EDW 应用系统是建立在 OLAP 软件平台的基础上,应用层应实现用户访问控 制的功能,针对不同的用户访问不同的系统资源来保证整个应用系统的安全性控 制。对于未来的数据仓库系统来说,应与统一门户平台整合,实现整体安全性管 理的策略; &nbsp;数据库层 &nbsp;银行数据仓库系统技术方案 V2.8 &nbsp;只有被授权用户才能访问和修改数据库中的信息并且数据在传输过程中应 对敏感信息进行加密处理来保证数据的安全。 &nbsp;数据库管理员应按照角色对数据库用户进行划分,并且通过赋予 角色权限的 方式实现对用户安全性访问控制的管理,如:针对用户组或耽搁用户分配特定数 据表访问权限。 &nbsp;系统层 &nbsp;系统应防止未授权访问和系统调用,及时进行系统安全补丁的更新。对于系 统主机应采用服务器加固的方法,来保证整个系统的安全性。 &nbsp;网络层 &nbsp;网络层安全是保证网络节点之间数据传递的安全性,以及网络环境不受恶意 攻击。 &nbsp;XX 银行数据仓库环境建立在企业内部网络中,不同功能的服务器应部署在 不同网段中,网段之间相互隔离,对网段之间的访问应通过防火墙并定义严格的 访问控制策略。整个系统的网络环境应得到实时监控,对入侵进行检测和处理 , 并在发生入侵时通知系统管理员。 &nbsp;物理层 &nbsp;物理层安全保障物理设备(主机、路由器等)不受非法用户攻击。目前物理 设备的安全性由运行中心负责。 &nbsp;管理 &nbsp;管理部分与上述的所有安全问题相关,对安全问题的管理必须由多个部门共 同协作完成。管理层面包括: &nbsp; 安全资源 :实现各种安全使用的资源,如:防火墙,入侵检测和处理设 备,反病毒软件等; &nbsp; 安全策略和规划 :各种安全规则,组织和责任人; &nbsp; 突发事件处理 :在发生安全威胁时的应急处理流程,包括:事件记录、 时间报告制度等流程; &nbsp; 安全审计 :对安全策略的审核和检查; &nbsp; 灾难恢复计划 :发生问题后的系统和数据恢复; &nbsp;银行数据仓库系统技术方案 V2.8 &nbsp;1.3 EDW 逻辑架构 &nbsp;1.3.1 逻辑架构框架 &nbsp;仓 库 存 储 区 固 定 报 表 灵 活 查 询 数 据 访 问 B / S 管 理 决 策 人 员 高 级 分 析 人 员 业 务 分 析 人 员 多 维 分 析 K P I W e b 服 务 器 用 户 层 访 问 控 制 层 系 统 管 理 财 务 系 统 数 据 落 地 区 E T L 开 发 E T L l o a d e x p o r t 集 市 应 用 E x p o r t 国 结 系 统 其 他 系 统 渠 道 系 统 人 力 系 统 系 统 管 理 维 护 人 员 数 据 平 台 层 汇 总 模 型 层 F i l e E T L 开 发 多 维 模 型 层 操 作 型 功 能 一 线 业 务 使 用 人 员 E T L J D B C E D W 灵 活 查 询 / K P I 驾 驶 舱 系 统 个 贷 系 统 核 心 系 统 对 公 信 贷 手 工 数 据 P a g e B e a n S e s s i o n B e a n A p p ; o c a t i o n B e a n R e q u e s t B e a n J S P P a g e B e a n J S P P a g e B e a n J S P R e q u e s t B e a n A J A X A J A X A J A X A J A X A J A X F i l e B e a n B e a n 通 用 展 现 平 台 报 表 / 复 杂 报 表 灵 活 查 询 系 统 管 理 仪 表 盘 数 据 集 市 层 D A O D A O D A O C o n n e c t i o n P o o l 框 架 引 擎 B O B O B O 数 据 分 发 权 限 统 一 管 理 统 一 用 户 门 户 ( 支 持 多 种 中 间 件 ) &nbsp;仪 表 盘 基 础 模 型 层 操 作 型 存 储 其 他 集 市 应 用 供 数 服 务 应 用 服 务 层 目 的 系 统 J D B C 数 据 源 层 技 术 元 数 据 操 作 元 数 据 业 务 元 数 据 安 全 管 理 体 系 应 用 安 全 数 据 安 全 操 作 系 统 安 全 网 络 安 全 数 据 消 费 传 输 通 道 e x p o r t F i l e 任 务 执 行 代 理 日 志 管 理 引 擎 任 务 调 度 引 擎 任 务 执 行 代 理 任 务 执 行 代 理 任 务 执 行 代 理 任 务 执 行 代 理 侦 测 器 E T L 调 度 管 理 和 监 控 器 依 赖 和 触 发 规 则 库 数 据 质 量 规 则 库 E T L 流 程 调 度 E T L A u t o m a t i o n 资 料 库 任 务 日 志 单 元 1 单 元 2 单 元 n 单 元 1 单 元 2 单 元 n 导 出 数 据 文 件 贴 源 层 标 准 化 层 如上图所示的 XX银行 EDW的逻辑体系架构,这一架构是在联科可扩展的 EDW 系统框架的基础上,结合 XX 银行信息系统建设的实际情况而设计出来的多层、 可扩展框架结构。架构的核心上包括源数据层、 ETL 流程调度、数据平台层、数 据集市层、应用服务层、访问控制层 、 用户层 和数据消费传输通道七个大部分, 另外,元数据管理和安全管理也是系统必不可少的部分,这 2 部分会涉及到所有 核心层次。 &nbsp;在明确定义各层之间的接口后 ,多层框架结构具有高度的扩展能力和方便的 系统开发和维护性能,符合目前流行的多层应用结构,适合 EDW 系统多阶段、多 层次的应用特点。 &nbsp;1.3.1.1 源数据层 &nbsp;【 功能与作用 】 &nbsp;总行的各个业务系统为整个 EDW 系统提供原始数据支持,首先作为 ETL 层的 数据抽取源。 &nbsp;【 组成部分 】 &nbsp;银行数据仓库系统技术方案 V2.8 &nbsp;目前总行的数据源包括 XX 银行的多个业务系统,主要有核心系统、个贷系 统、对公信贷系统、国际业务系统、财务系统和各类渠道系统等。 &nbsp;1.3.1.2 ETL流程调度层 &nbsp;【 功能与作用 】 &nbsp;该层为 EDW 数据流向的主要环节, EDW 系统数据流动的流程调度核心层,流 程调度主要针对下面几个方面: &nbsp; EDW 系统将数据源的数据抽取到数据落地区 &nbsp; EDW 系统对数据执行格式转换、排序去重、通用数据清洗、业务转换后 等操作,最终完成数据准备区加载。 &nbsp; EDW 系统再将数据准备区的数据按照 EDW 数据模型的方式加载到数据存 储区中。 &nbsp; 在数据存储区中进行基础数据层、加工汇总层和应用集市层的数据加载。 &nbsp; EDW 中的数据准备区和数据存储区可以为为其它系统提供数据服务。 &nbsp; 总行 EDW 可以为分行 EDW 提供数据服务。 &nbsp;【 组成部分 】 &nbsp;上面的逻辑架构图淡绿色色矩形部分为 ETL 调度管理技术架构图,其作用 是让许多的任务在作业的执行条件满足时自动地执行。 ETL 调度管里最基本的可 执行元素是单元,每个单元是完成某一特定功能的程序,相关单元组合在一起构 成了可以调度的最小组件 任务。由上面的技术架构图可知, ETL 调度管里包 含下列组件: &nbsp; 知识库 &nbsp;建立在 DB 中的一个数据库,包含了与流程调度相关的一组表,保存 ETL 流 程调度服务器、任务、任务之间的依赖触发关系、任务组、调度计划等多种类型 的信息。 &nbsp; 侦测器 &nbsp;驻留在后台的服务,基于定义的触发规则和调度计划 监测是否触发任务的执 行。 &nbsp; 任务调度引擎 &nbsp;接受侦测器的信息调度任务执行(可以使本服务器任务也可以是其它服务器 银行数据仓库系统技术方案 V2.8 &nbsp;的任务)。 &nbsp; 任务执行代理 &nbsp;调用任务包含的每个单元执行的服务,同一服务器上可以有多个任务执行代 理同时运行。 &nbsp; 任务 &nbsp;封装在 Perl 程序中,执行数据加载、整合、立方体生成等工作的一组程序。 &nbsp; 日志管理引擎 &nbsp;记录 ETL 调度管理各个服务器组件以及每个任务的执行日志,日志按天保存, 可以定期清理。 &nbsp; 管理监控器 &nbsp;Java 应用程序,用于定义任务、任务组合触发关系等信息,同时可以实时 监控任务执行情况查看日志。 &nbsp;作为专门为数据 仓库系统设计的流程调度管理具有如下特点: &nbsp; 任务执行代理可分布在多台服务器上。 &nbsp; 结构简单、伸缩性强。 &nbsp; 支持多种执行任务。 &nbsp;1) 加载数据 &nbsp;2) 整合数据 &nbsp;3) 数据质量检查和清洗 &nbsp;4) 数据转换 &nbsp;5) OLAP 数据生成 &nbsp;6) 数据挖掘模型的执行 &nbsp;7) 定制报表的产生 &nbsp;8) 定制页面的产生 &nbsp;9) 数据库备份、告警等系统作业 &nbsp;10) 调用其他 ETL/ELT 工具产生的任务 &nbsp;11) 数据导出到指定的渠道系统 &nbsp; 执行的任务可以是另一个任务调度引擎触发(如: EDW)。 &nbsp;银行数据仓库系统技术方案 V2.8 &nbsp; 可以启动其它的 ETL 引擎的任务。 &nbsp;1.3.1.3 数据平台层 &nbsp;【 功能与作用 】 &nbsp;作为本系统的数据核心部分,它负责存储和管理来自各种源数据系统的数据, 并为访问用户提供数据服务。 &nbsp;这些数据是按照在逻辑数据模型分主题存放的。 &nbsp;【 组成部分 】 &nbsp;本层由操作型存储区、仓库存储区和集市应用层四个部分组成。详细内容参 见“ EDW 数据架构” &nbsp;1.3.1.4 数据集市层 &nbsp;【 功能与作用 】 &nbsp;数据集市是一组特定的、针对某个主题域、部门或用户分类的数据集合。 这些数据需要针对用户的快速访问和数据输出进行优化,优化的方式可以通过对 数据结构进行汇总和索引。通过数据集市可以保障 EDW 的高可用性、可扩展性和 高性能。 &nbsp;【 组成部分 】 &nbsp;包括:驾驶舱 报表系统和灵活查询以及其他应用集市系统。 &nbsp;1.3.1.5 应用服务层 &nbsp;【 功能与作用 】 &nbsp;通过对数据平台层中的数据进行适当的提炼、汇总,利用通用展现平台向用 户提供包括报表服务、查询服务、决策仪表盘等相关服务。该层为用户对中央数 据的访问提供各种方式的服务( C/S、 B/S),从而实现访问方式的多样化和信息 存取的透明化。 &nbsp;【 组成部分 】 &nbsp;通用展现平台主要包括的功能模块有: &nbsp;第一个层次是核心模块包括:框架、引擎,核心模块作为报表集成开发环 境的基础、核心和框架存在。报表集成开发环境核心功能和模块组装由核心模块 银行数据仓库系统技术方案 V2.8 &nbsp;统一提供,只暴露给开发人员; &nbsp;第二个层次是管理模块包括:报表信息、基本管理、代理、信息推送、连 接信息,管理模块为报表集成开发环境提供管理服务,它提供报表集成开发环境 的用户、权限等的统一管理,管理模块也是报表集成开发环境必选模块,它的很 多功能调用由核心模块提供,管理模块包括 5 个子模块; &nbsp;第三个层次是应用模块 包括:仪表盘、灵活查询、数据录入、报表、复杂 报表 ,应用模块提供报表集成开发环境最终用户(非管理人员)的用户体验,可 以和管理模块相结合有选择地灵活部署。 &nbsp;1.3.1.6 访问控制层 &nbsp;【 功能与作用 】 &nbsp;访问控制层主要包括 WEB、认证、安全、门户四方面的服务。 该层位于用户 层和中间服务层之间,为用户层成提供 HTTP 服务、门户的单点登录、用户统一 认证、提交用户层请求到中间服务层,对用户实施安全策略,为用户管理报表、 查询文档,提供个性化定制等。 &nbsp;1.3.1.7 用户层 &nbsp;由上面的逻辑架构图可知用户层包括各种最终用户。按照用户使用 EDW 系统 的方式和特点,可以划分为业务分析人员、高级分析人员和管理决策人员。所有 用户统一通过用户门户访问 EDW系统各类应用,从而实现了 EDW系统的应用界面、 安全管理统一,同时用户可以对门户进行个性化定制以方便自己使用。 &nbsp;实际上, EDW 系统还包括进行系统建设的开发 人员、系统运行人员和系统管 理人员,这里所指的用户层主要针对业务用户进行描述。 &nbsp; 业务分析人员 &nbsp;主要指总行各业务部门、各分行的业务用户,如:客户经理。该类人员直接 使用模块化的应用界面访问 EDW 系统,生成或预览预定义报表,进行相对固定的 查询以及多维分析。这类用户会使用 B/S 和 C/S 两种客户端访问 EDW 系统。 &nbsp; 高级分析人员 &nbsp;是指总行各业务部门、各分行的较为高级的用户。除能够执行一般业务分析 人员进行的操作外,可以对指定的主题、指标进行自定义的灵活分析和比较。分 析的方式包括自定义查询、自定义报表、多维旋转和穿透钻取等等。这类用户会 银行数据仓库系统技术方案 V2.8 &nbsp;使用 B/S 和 C/S 两种客户端访问 EDW 系统。 &nbsp; 管理决策人员 &nbsp;主要包括各部门的领导、分行领导和总行领导。 EDW 系统为管理决策人员分 配专门的系统资源,建立最为直观和方便的存取界面,为决策人员赋予最大的信 息访问权限,实现决策人员对信息的自由访问。同时, EDW 系统将决策人员最为 关心的信息主动发布到决策人员的访问界 面上,简化信息访问的方式,使得决策 人员在第一时间获得经营管理的各种重要信息和指标。这类用户只会使用 B/S 客户端访问 EDW 系统。 &nbsp;1.3.1.8 消费数据传输通道 &nbsp;在数据仓库系统建立以后,会有很长一段时间旧有的报表系统和分析系统需 要逐步迁移,在此期间,需要有一个消费数据传输通道来支持旧有系统的良好运 转。 &nbsp;1.3.1.9 安全管理体系 &nbsp;安全管理体系主要包括以下四个方面: &nbsp; 网络安全 &nbsp;主要包括在不同网络层次设置不同级别的防火墙及 IDS 系统,同时在每 一个安全层次下通过部署不同的安全原则,这完全符合 XX 银行的安全级 别规定。 &nbsp; 操作系统安全 &nbsp;系统所有应用或数据库服务器均采用 Unix 操作系统,操作系统本身有着 严密的系统安全认证与用户权限管理体系,并具备登录、审核以及资源 访问的审计与跟踪。 &nbsp; 数据安全 &nbsp;提供各种基于数据库的安全保护机制。 &nbsp; 应用安全 &nbsp;应用是直接面对用户的,虽然应用系统能够持续提供服务是涉及到系统 安全的问题,但是因为这些问题更多的是由系统的安全问题来保证的。 所以就应用级的安全策略更多的是保证对数据访问的合法性。 &nbsp;银行数据仓库系统技术方案 V2.8 &nbsp;1.3.1.10 元数据管理体系 &nbsp;在机构内关于数据的信息称为 “ 元数据 (Metadata)” 。清楚地区分数据 库 中 的数据和元数据是很重要的, 所谓元数据 ,是指关于数据的数据,即用来描述数 据的类型、来源、定义、存储位置,使得可以正确地使用数据仓库。 &nbsp;元数据仓库 (Meta Data Repository)对业务人员来说是很重要的,是业务人 员与数据仓库的数据交流的传达手段。 IT 人员可能已经拥有许多有效的工具进 行数据存取。但对业务人员,他们需要一种手段和工具来理解他们存取的数据。 &nbsp;在本期 EDW 系统的建设中,包括技术元数据和业务元数据两类,其数据源涵 盖了 EDW 系统的各个环节,包括:数据源系统、 EDW 数据库、 EDW 逻辑数据模型、 ETL 系统、业务应用系统等,同时,还将涉 及数据的业务含义和业务规则等相关 业务文档。在架构上,元数据系统包括:元数据应用、元数据报表、元数据分析、 元数据集成系统、元数据展现系统、元数据管理系统、元数据维护系统。 &nbsp;1.3.2 数据处理流程 &nbsp;各业务数据源系统通过多种方式 (如: ETL 工具直接从源系统获取、源系统 数据批量导出 )将数据获取过来 ,由数据落地区区进行集中管理。 &nbsp;后续的数据加工、转换通过 ETL Server 来完成 ,中间采取不落地的方式 ,将 加工完毕后的数据放在数据准备区域。 ETL Server 可通过 ds job,FTP,NFS 等 方式从数据落地区获取数据,将 处理后的结果放在数据准备区域。再将数据准备 区的数据加载到数据存储区中。 &nbsp;根据目标系统的不同 ,采用灵活的方式向外提供数据 ,可使用 ETL 工具直接 向目标系统加载或者通过 FTP 方式向其他目标传输。为支持其他的业务需求 ,将 近期 (30-60 天 )的明细数据、流水数据集中存放在数据库系统中 ,日常增量数据 刷新数据库系统。 &nbsp;整个过程通过调度工具进行统一调度 ,集中管理 ,确保各项任务有序完成。 &nbsp;1.4 EDW 运维架构 &nbsp;1.4.1 运维架构概述 &nbsp;下图中给出了 EDW 的运维架构,是在 EDW 系统上线后,为了保持系统良好的 稳定性而定义的相关的管理需求。运维架构主要是针对执行架构的数据导入层、 银行数据仓库系统技术方案 V2.8 &nbsp;数据服务层、中间服务层和访问控制层服务器进行管理,面向的最终用户是 IT 人员。 &nbsp;图 1 运维逻辑体系架构 &nbsp;运维架构中包含了如下组件:系统监控管理组件、系统维护管理组件、备份 恢复管理组件、故障切换管理组件、性能容量规划组件和运维安全管理组件。各 个组件的主要功能如下: &nbsp; 系统监控管理组件: 监控网络 /系统性能、运行,以及诊断和报告故障。管 理的硬件和软件包括所有开发、测试和生产环境中的硬件和软件。 &nbsp; 系统维护管理组件: 系统维护是指系统在运行过程中,为了系统的正常服务 而进行的配置、参数管理,以及启 /停机、清理过期数据等日常操作,以及 数据、系统发生变更的维护等。 &nbsp; 备份恢复管理组件: 备份 /恢复管理组件处理系统中所有必须的备份和恢复 操作。这个组件根据备份策略,通过对数据的冗余存储来保证系统可以从各 种服务中断中恢复。 &nbsp; 故障切换管理组件: 故障切换管理提供了管理和控制应用切换的机制。故障 切换组件使用冗余系统和数 据来保证关键任务数据流不间断。当发生故障或 失败时,该切换发生在主系统和备份系统之间。 &nbsp; 性能容量规划组件: 性能及容量规划从环境中的不同元素收集利用数据,并 规划硬件和软件能力需求。 &nbsp;银行数据仓库系统技术方案 V2.8 &nbsp; 运维安全管理组件: 运维安全管理组件通过制定和管理运维安全策略,并利 用安全工具,维护信息系统资产(包括硬件、软件、用户数据、信息 /数据) 的机密性、一致性和可用性。 &nbsp; 运维环境管理组件: 运维环境管理用于确保物理环境和系统环境的妥善管理 和保护,不受故障和灾难的侵害,以及不受人为因素的干扰和破坏。 &nbsp;整个运维架构通过一些标准的流程实现生产环境运 行管理,包括的流程主要 是日常操作流程和特殊操作流程。日常操作流程是指 IT 用户在日常为维护生产 环境正常运转需要做的工作,如:数据仓库管理、系统监控、备份恢复、容量规 划。特殊操作流程不会每天发生,这一流程的启动通常是由于系统软硬件升级、 数据变更、新增应用等需求引起的。 &nbsp;1.4.2 运维架构的逻辑框架 &nbsp;1.4.2.1 系统监控管理 &nbsp;在 EDW 系统中,需要监控管理的系统元素可以分为如下五类: &nbsp; 网络 /主机管理:用于监控、控制和报告网络及主机状态。 &nbsp; 数据库 /数据仓库管理:提供相关监控信息源 ,控制各个独立的服务器或数据 库 /数据仓库。应监控所有的关键数 据库 /数据仓库性能比例,以</p>

    注意事项

    本文(银行数据仓库系统技术方案V2.8.docx)为本站会员(fo****g)主动上传,悟道方案网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知悟道方案网(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    悟道方案网站 版权所有 | @ 2017-2021 | 经营许可证编号:鄂ICP备19004533号-1 鄂公安网备:42018502003423号 51LA统计
    扫码沟通

    扫一扫,及时沟通问题

    咨询沟通
    扫码关注

    关注本站微信公众号

    返回顶部