信息集成平台之数据质量管理

文章附图

摘 要

质量管理是信息集成平台的一个基础的功能,通过质量管理提高交换信息的互操作性及数据的准确性;同时提高数据中心的数据质量。本文从全面质量管理为出发,以PDCA的质量方法进行设计,探讨信息集成平台在质量管理的最佳实践。

关键词集成平台;全面质量管理;PDCA

正文

1、引 言

PDCA循环又叫戴明环,是美国质量管理专家戴明博士提出的,它是全面质量管理所应遵循的科学程序。全面质量管理活动的全部过程,就是质量计划的制订和组织实现的过程,这个过程就是按照PDCA循环,不停顿地周而复始地运转的。

参考PDCA管理方法,实现信息集成平台的全面数据质量管理实现,形成如下图如示的数据质量管理框架构:


2、数据质量计划

数据质量标准定义与具体的数据集相关,实际上是定义数据集中各数据元的质量标准,

质量标准一般涉及到以下几方面的内容:数据元编码规范、数据类型、数据长度、是否非空、数据值格式、缺省值处理、值域范围、取值范围、数据项与数据项之间的逻辑关系。通过对业务需求的分析,我们对数据集中各数据元进行具体的质量标准定义,同一个数据元可以有多个质量标准;不同的数据元之间也可以定义数据质量标准。

形成数据质量标准后,接下来的工作需要把标准固化到信息集成平台中,以实现平台对

质量标准的承载,平台对质量标准定义如下图所示:


数据质量标准固化到平台后,需要及时通过平台的标准发布功能,把数据质量标准发布给第三方,让第三方系统接入时遵守平台定义的数据质量标准,如下图:


3、数据质量标准控制

信息集成平台对于系统接入时质量控制有两种机制实现:

1、第三方系统通过程序改造方式进行数据接入:第三方接收到平台给出的系统接入标

准(其中包括数据质量标准),在做程序改造时,在自己的程序中进行相应质量转换,以实现系统自身质量标准与平台提供的质量标准转换;

2、第三方系统通过适配器方式进行数据接入:平台提供的适配器能获取平台的接入标

准(包括相应的质量标准),同时提供各种转换能力,如数据项之间的映射,如某系统name(姓名)与平台提供的DE02.01.064.00(姓名)字段名称的转换;如值域转换,如某系统性别值域与平台中的性别值域转换。通过在适配器中进行质量标准映射,实现在数据交换过程时系统给出的数据质量符合平台定义的标准。

信息集成平台对于系统接入后质量控制机制实现方式:

1、数据元名称映射:把某个系统的数据项名称转成平台数据元名称;

2、数据元类型转换:把某个系统的字段类型转成平台定义的数据元类型;

3、数据元长度处理:某个系统的字段长度可能大于平台定的长度,此时平台需要提供策略来应对这种情况,如对字段值进行截取让业务系统适应平台数据元的质量要求;或自动增长平台数据元的长度来适应业务系统的要求;

4、数据值格式转换:把某个系统的数据值转成平台质量标准定义格式;

5、非空处理:对于定义为非空的数据元,如果有空值进入,则不允许这种数据进入平台;

6、缺省值处理:对于定义了缺少值的数据元,如果出现空值,则用缺少值进行代替;

7、值域转换:把某个系统的值域转换成平台定义的值域标准;

8、取值范围处理:对于定义了取值范围的数据元,如果不符合相应的取值范围,则不允许这样的数据进入平台;

9、数据项与数据项逻辑关系:数据集中定义了此种质量标准,则出现数据项有逻辑错误时,则不允许这种数据进行平台,如检验报告为男性的报告,不允许出现了女性特有的检验项,如果出现了,这种数据不允许进入平台。

4、数据质量收集与分析

发布给平台的各种数据,平台中的数据质量分析服务会对这些数据质量符合度进行分析与检测,形成质量报告数据,如下图:


5、数据质量改进

根据数据质量报告分析数据,可以帮助信息集成平台使用单位做以下的事件:

1、进一步完善数据质量标准:如某个数据元值域标准定义不完整、某个数据元长度定

义不够;

2、指导接入厂商完善某个专业系统:专业系统建设时可能没有考虑到外部交换的需要,

在某些数据项填写不完整或不规范,通过质量报告的结果可以促进业务系统不断的改进与完善。

总结

本文以信息集成平台数据质量管理作为探讨的基础,通过在信息集成平台中引入PDCA的管理方法,实现数据质量的全过程的管理实现,有效的解决医院标准不一、数据质量不高的业务现状,为进一步提高数据质量与完善质量标准提供良的基础