• 业务咨询、市场合作:61619362
  • 公司邮箱:support@datatom.com
联系我们  | English

政务数据质量管理的发展现状

作者:郑治国     来源:站内原创     2020/11/25 09:55:13    

 


政务数据是政府在公共管理与公共服务过程中依法获取的海量政务数据信息,在其基础上海量数据的深度挖掘后发现事物的规律从而实现科学决策,是国家治理体系和治理能力现代化的具体表现。它的基础是政务信息化。

 

现阶段我国数字政府平台的建设取得了较大的进展,伴随着数字政府平台的投入使用,大量的政务数据也随着产生,而数据量的增加必然带来数据质量的管理问题。通过对数据质量管理体系的研究,提高政务数据的质量,明晰政务数据质量管理的架构、流程、机制、评价指标、规范等,建立健全数据质量的管控机制,指导数据质量提升,更好地为数字政府、互联网+政务服务及“放管服”提供良好的数据化和智能化支撑。

数据质量管理的研究现状
数据质量管理是组织变革管理的关键支撑流程,是根据组织业务需求制定标准,并确保得到遵守的持续动态过程。有助于将组织注意力、资源和行动集中于提高大数据产品和服务质量上。质量管理贯穿于数据生命周期的每个阶段,是各阶段数据质量问题识别、度量、监控、预警等的系列管理活动,包括过程、方法、标准、准则、体系和质量参数等核心内容。数据的复杂性、异构性特征及其质量动态性、情境化特点,给其管理提出新的挑战。其管理思想与根本原则应不同于常规数据质量管理。Loshin强调指出,基于数据特点和质量可变性,数据质量管理的重点聚焦于数据集的评估和对数据的纠正措施,以确保数据集符合其最初任务目标、应用情境和预期。

在质量管理框架和模型研究方面,虽然Ge等指出,受可扩展性和数据流处理限制,不能简单地将传统数据质量管理模型应用于数据质量管理之中。但在大部分研究中,ISO38500的IT治理标准、DGI数据治理框架、IBM数据治理委员会数据治理要素模型、COBIT5数据治理基本原则、Gartner数据管理参考框架及数据治理和信息管理要素模型、DAMA数据管理知识体系(DMBOK)框架等成为数据质量管理研究的重要参考模型。

在此基础上,Taleb等基于数据流程阶段和生命周期并与数据处理过程相结合的全面质量管理(QBD)模型、Rao等基于业务语境构建形成过程驱动的数据质量管理(PDDQM)模型、Chen等提出基于系统体系工程和质量生命周期管理(QLM)动态一致性质量管理框架等,均是以数据质量管理核心目标为基础,体现了任务情境、具体应用目标等数据质量管理特色。

在质量管理内容研究方面,数据质量贯穿于整个数据生命周期,需要对生命周期和数据工作流程中每个阶段的数据质量进行针对性跟踪管理、监测和控制。结合大数据质量过程与阶段属性,Becker等指出,大数据质量管理包括测量过程(分析、测量和评估)、操作过程(信息使用、数据清理、数据运营管理、DQ改进)两个方面,并受其他过程环节影响,具体由质量评价、计划、转化、监控等内容所构成。而Reddy等提出了由数据测量、知情使用、数据清理、数据操作管理和数据改进等活动构成的基于大数据处理流程角度的大数据质量管理体系。以上研究均强调管理内容与不同阶段、过程中质量要求的有机结合。

针对数据结构复杂性与数据质量多维性,Saha等、金范分别提出面向结构化和半结构化数据等角度的数据质量管理思想,必须以半结构化、非结构化等不同数据类型为基础。但从数据分析的角度来说,结构化数据也仍是今后分析的重点。制定质量标准和提出管理方略。与此同时,Haryadi等从管理要素角度指出,数据质量管理应该涵盖数据、技术、过程(或程序)、人员、组织、外部环境等多方维度和若干要素。而Immonen等进一步指出,元数据管理是数据质量管理的基础和重要构成,主要包括元数据管理和质量管理两个功能。

从更为宏观视角,Gao等提出由组织管理、数据管理和质量保证管理等构成的大数据质量管理体系,体现了广义质量管理思想。也有学者指出,大数据战略作为国家或组织战略和竞争力的重要构成,从顶层设计到底层实现“落地”过程中,治理是基础,质量管理是治理的核心。现在普遍存在的战略性规划缺失,带给数据质量严峻挑战。

由以上研究可见,围绕数据质量基本目标、任务类型和应用情境的质量管理研究,有机契合数据质量可变性、异质性、多维度和情境化属性与本质,聚焦于数据流程和数据生命周期、数据结构和质量要素的质量管理框架、模型和具体内容,集中于领域视角、环节视角的切入和组织视角的剖析。体现了数据质量管理的多方位视角,所提出的思想更具前瞻性与发展性,方略更具微观性与适用性。

数据质量管理标准

在国际标准分类中,数据质量管理涉及到质量、信息技术应用、公司(企业)的组织和管理、航空器和航天器综合、工业自动化系统、信息技术(IT)综合、商用车辆。同时,在我国的标准分类中,数据质量管理涉及到标准化、质量管理、数据元表示方法、标准化、质量管理、电子计算机应用、信息处理技术综合、电子计算机应用、社会公共安全综合、电子计算机应用、载货汽车等,如下表1所示。
 


 

我国目前政务数据质量管理现状
目前,我国大部分地区已着手布局大数据战略和产业,旨在充分发挥数据资源的价值,并且在基础数据资源的汇聚、治理和利用上开展多方面的尝试和探索。这其中,各地对数据质量的重视程度也越来越高。

在我国其他省市,针对大数据建设也提出了较多规划。其中,数据质量是大数据管理与分析的重要组成部分之一。

例如,2014年2月,广东省率先提出设立广东省大数据管理局,并正式公布了《广东省大数据发展规划(2015-2020年)》,为大数据产业发展注入了强大动力。上海、北京等地率先推出了政府数据资源开放共享网络平台,整合本地区数十个部门的政务大数据资源,向全社会开放共享,为企业和个人开展政务信息资源的社会化开发利用提供数据支撑。贵州省提出建设“云上贵州”计划,力争成为全国首个基于云计算建成省级政府数据共享平台的省份。2015年4月,国家发改委正式成立了国家发改委互联网大数据分析中心,在部委中首个专门成立了大数据分析中心,全面支撑国家发改委宏观调控和重大决策。

数据质量的管理体系建设方面,各省市也分别形成了自己的方法与经验。总体情况如下:

 初步理清政务数据质量管理权责,但统筹力度不尽相同当前全国 31 个省(自治区、直辖市)中,有 22 个地区(占比 68.8%)明确了政务数据统筹管理机构,即在机构职能中明确了数据资源管理责任。 

例如,上海市明确“公共数据质量管理遵循‘谁采集、谁负责’‘ 谁校核、谁负责’的原则,由公共管理和服务机构、市级责任部门承担质量责任。市大数据中心负责公共数据质量监管,对公共数据的数量、质量以及更新情况等进行实时监测和全面评价,实现“数据状态可感知、 数据使用可追溯、安全责任可落实”。

各省(自治区、直辖市)根据本地区实际设置的政务数据管理机构类型各不相同,主要包括以下几种: 
 

1). 政府组成部门,如北京的大数据管理局、内蒙古的大数据发展管理局、陕西的政务数据服务局和大数据管理与服务中心等;

 

2). 政府直属机构,如广东的政务服务数据管理局、山东的大数据局、贵州的大数据发展管理局等;

 

3).政府部门内设机构,如山西的大数据产业办公室为省工信厅内设机构等;

 

4). 政府部门管理机构,如浙江的大数据发展管理局、福建的数字福建建设领导小组办公室 (省大数据管理局)、河南的大数据管理局等;

 

5). 政府部门管理的事业单位,如天津的大数据管理中心、黑龙江的政务大数据中心、上海的大数据中心等;

 

6). 企业法人,如海南的大数据管理局;

 

7). 省直事业单位分支机构,如辽宁省大数据中心;

由于数据管理机构的行政级别、机构性质不尽相同,政务数据的统筹管理力度差异较大。一般来说,政府组成部门、政府内设机构等的统筹力度相对较大。各地数据管理机构的设置情况,也可以从侧面反映该地区对数据的认识水平和重视程度,一定程度上影响数据质量管理力度。
 


随着数据日益成为社会经济重要生产要素,更要明确数据管理的统筹部门和职责体系,提升统筹能力和管理力度,保障数据质量,更好释放数据价值,提升行政管理和公共服务能力。

■ 部分地区制定专项政务数据管理政策法规,从制度层面保障政务数据质量。目前31 个省(自治区、直辖市)中,有 28 个(占比 87.5%)制定了数据资源管理相关制度文件。其中,仅北京、上海、贵州等 10 个地方(占比 31.25%)专门针对政务数据制定了综合管理办法;其他地区多聚焦于政务数据资源共享、开放、安全使用等政务数据应用管理的特定环节或特定方面。
 


但数据不同于传统资源,数据具有大容量、多样性、可复制、高速传播等特点,无法直接适用土地、矿藏等传统资源管理办法,须不断探索建立针对数据资源的政策法规,确立数据地位,加强数据质量维护与管理。

 

■ 数据管理范畴不尽相同,对同一名词也尚未统一概念内涵。从各省(自治区、直辖市)政务数据管理相关政策文件制定情况来看,各地对于数据定义各不相同,包括公共数据、公共信息资源、政务数据、政务信息资源、政务信息资产等不同提法,说明各地对数据和信息的理解、对政务数据和公共数据的理解、对数据是资源还是资产的理解均不一致。甚至是基于同一种提法,不同地区的内涵界定也不相同,例如,同样是“公共数据”,北京、吉林等地的内涵范畴包括了本市各级行政机关和公共服务企业在履行职责和提供服务过程中获取和制作的电子形式数据;而上海、浙江等地则不包含公共服务企业产生的数据。 
 


在数据日益重要的今天,亟需明确政务数据、公共数据内涵体系,为确定数据管理范畴、明确数据质量标准奠定基础。

■ 目录管理、清单管理制度不断完善,数据开放、开发利用管理亟待完善。调查显示,31 个省(自治区、直辖市)中,有 29 个地方通过政策文件形式明确了实行政务数据统一目录管理理清数据共享交换管理流程、强化共享交换数据质量职责的要求。部分地区利用区块链等新技术,提升数据质量,提高共享效率。

例如,北京市经信局、编办和 财政局牵头政府各相关部门借助大数据、区块链、云计算、人工智能等新技术,打造北京市的“目录区块链”。具体而言就是各部门的“职责目录”一一对应,形成全市“数据目录”一本大台账。利用区块链的分布式存储、不可篡改、合约机制等特点,建立起北京市“目录区块链”, 将各部门目录“上链”锁定,实现了数据变化的实时探知、数据访问的全程留痕、数据共享的有序关联。这样一来,哪个部门有哪些数据一目了然,申请共享的渠道也更通畅。

有 20 个地方明确提出实行分级分类清单管理。例如:上海市建立“三清单”制度,即公共管理和服务机构根据法定职责,明确本单位可以向其他单位共享的数据责任清单;根据履职需要,形成需要其他单位予以共享的数据需求清单;对法律、法规、规章明确规定不能共享的数据,列入共享负面清单,明确了数据资源共享的边界,也进一步强化了数据质量保障责任。 

有 9 个地方明确了数据开放管理要求。例如,山东省提出政务数据按开放类型分为无条件开放、有条件开放和非开放三类。其中,可以提供给所有公民、法人和其他组织使用的政务数据资源属于无条件开放类;可以部分提供或者需要按照特定条件提供给公民、法人和其 他组织的政务数据资源属于有条件开放类;涉及国家秘密、商业秘密、个人隐私和国家安全,以及其他不宜提供给公民、法人和其他组织的政务数据资源属于非开放类。

有 6 个地方对政务数据开发利用规则进行了探索。例如,海南通过制定了地方法规《海南省大数据开发应用条例》,探索数据开发利用,“鼓励大数据生产经营单位通过共享获得、联机验证等方式采集数据”,规范数据采集行为,保障数据可靠性。

■ 部分地区加强信息服务内容保障,推动透明政府、惠民政府建设。随着供给侧改革的推进,不少地区加强政务数据管理与应用,推出一批接地气、百姓喜 闻乐见的服务,提升政府信息公开的透明度与公共服务的均等化、普惠性。例如,北京市建立了“京津冀区域政务服务一网通办专区”,对接“京津冀+雄安”四地政务服务系统,首批上线了20 个全程网办事项和 43 项线下服务事项,涉及企业开办、公积金、社保、出入境等领域,不断提升区域服务能力。

得力于中央政府政策的指导和推动以及各地方政府的认真落实与创新设计,我国的政务数据管理体系得到了长足的发展。当然,为了实现真正全面的数字政府、信息化政府管理,还需要各级政府官员与研究人员更多的努力与投入。