大数据创新经过多年的快速发展,已经比较明显地分为两个阶段,第一阶段是包含数据归集、治理的“数据工程”,第二阶段是价值探索和应用的“业务创新”。
当下,部分走的比较早的市级政府已经在第一阶段中完成了数据的归集和治理,大步迈入数据价值体现的第二阶段,例如上海市政府已经从大数据中心的归集、治理迈向了“一网通办”、“一网通用”和“随申码”应用。然而在县域级别,目前仍处于数据归集、治理的“数据工程”第一阶段。
”郡县治,天下安。”如何在县域级别探索大数据价值,应用于县域治理是一个重要的课题。长兴县大数据发展管理局在2019年下半年多次与德拓沟通,于2019年年末到德拓公司实地考察调研,了解并认可德拓的产品、技术能力。原计划2020年上半年开展的项目,受疫情影响,项目交付团队在2020年7月驻场开展项目建设。
长兴县大数据项目,基于长兴县现有各业务部门数据,开展数据治理平台建设、数据标准规范建立、数据质量探查、数据治理加工、数据主题专题应用等方面的建设,促进长兴县整体数据质量的提升,扩展更多的主题专题应用。
结合长兴政府的大数据实践,我们认为,实现县域数据治理需完成以下几步:
01 建设治理平台,实现数据治理
“工欲善其事,必先利其器。”数据治理平台的建设,能够优化数据开发人员的工作效率,更实现了数据的统一管理。长兴使用原有CIG平台实现了数据的”管”,使用德拓DanaStudio数智开发平台+DDP大数据基础引擎平台实现了数据的”理”,通过德拓产品实现了数据采集、数据治理、主题融合、专题应用的建设。
02 提升数据质量,夯实数据基础
数据质量的保障,是实现数据价值的前提,各业务部门的数据质量参差不齐,或多或少会出现数据质量问题。根据全国信息技术标准化技术委员会提出的数据质量评价指标(GB/T36344-2018 ICS 35.24.01),数据质量评价包含以下几个方面:
事中监控主要是利用平台化手段,对汇集的数据进行探查、清洗、加工、融合,下图为长兴通过DanaStudio数智开发平台数据治理模块对流动人口数据进行数据质量探查:
根据各业务单位数据的属性,长兴制定了下列探查规则:
根据数据探查规则,平台会生成相应的问题数据:
2.3 事后改善
事后改善是通过建立流程和数据治理方法,通过人工、工单、自动化等方式将质量问题修复掉:
2.3.1 建立流程:
通过良性的循环,达到数据质量的提升,长兴数据质量提升的PDCA流程如下: