智慧城市数据管理面临的机遇与挑战


(一)数据中心建设方兴未艾

当前,“互联网+”的社会运行模式正在深刻改变着人们的生产生活方式,数据中心作为一种新型基础设施,已成为支撑城市建设和经济运行的中枢系统。随着“网络强国”战略全面实施和新型智慧城市建设加快推进,城市数据中心的作用和战略价值更加突出。为此,各省市积极抢抓新一代信息基础设施建设的重要机遇,加快城市级数据中心的建设布局,大力支撑新型智慧城市建设,并借机带动大数据产业发展。


城市数据中心借势上位

随着物联网、云计算、大数据、移动互联网等新一代信息技术的快速发展与广泛应用,信息基础设施成为了新的高速公路”,信息资源成为了战略性资源,积极推动经济社会向数字化、智能化、智慧化转型升级。城市数据中心已成为智慧城市建设的标配设施,数据中心作为数据采集、传输、存储、加工的核心,直接决定着城市各个应用系统的正常运行能力。


城市数据中心数量激增

当前数据中心产业进入了大规模规划建设阶段。各省市根据国家相关政策文件,加快制定实施新兴产业发展与数据中心建设规划,积极推动城市级云数据中建设,通信运营商、大型互联网企业、信息通信设备制造商及国际IT巨头等纷纷投入到各种模式的数据中心建设浪潮中,推动了各地各种数据中心雨后春笋般的急。


(二)数据中心遭遇成长烦恼

城市数据中心市场虚火较大。由于各省市信息化建设步伐的加快,以及培育云计算、大数据等新兴产业的经济发展需求,造成了各地市不断加大招商引智规模,大力加强以云计算技术为核心的城市数据中心,不少城市至少有2个数据中心,个别多达5个以上,数量呈现过剩。


城市数据中心可能带来巨大资源财力消耗。数据中心建设不仅带来服务器、网络设备及相关基础设施的损耗,长期运营也将带来巨大的电力损耗,有预测到2020年我国数据中心能耗将达到1000亿度,同时还可能带来大量的人力和管理成本剧增。


城市数据中心普遍存在缺乏有效数据的现象。由于长期以来我国缺乏数据资源管理和应用的基础,制度缺乏、数据缺失、数据质量低、数据流动性差现象比较严重,这就造成了数据采集、比对、共享、开放的难度超出了想象,打破“信息孤岛”举步维艰。


城市数据中心运营缺失强有力的支持系统。 近年来,城市数据中心的功能着重在数据归集、系统云化、平台建设等功能升级上,但缺乏统一的标准规范及数据中心基础管理系统,各城市数据中心基本上都是根据各个IT公司的解决方案搭建数据管理与应用系统,模式多样、功能不一、架构自定,不仅造成了新的区域孤岛,且带来了公共信息资源管理的混乱,使数据资源的价值大打折扣。这已成为我国城市数据中心建设存在的最大软肋,直接影响各地市信息化发展水平,极大制约新型智慧城市建设及“互联网+政务服务”的实施。


(三)数据管理运营面临挑战枚举

1.全域信息资源能否清晰、动态、直观的掌握,定时管控?

2.全域数据资源能够实现部门按需高效共享?

3.能否为领导和决策部门按需及时提供各类数据,准确、动态、直观生成相关报告?

4.能否基于数据元(字段)进行灵活数据抽取,实现多样化数据模型生成和服务场景设计?

5.数据资源能否灵活、动态、高效地进行更新、维护、关联和调用?

6.中心能否与所有的参与部门实现数据资源共建、共享、共管和共用?

7.能否与上级垂直系统和下级市区高效规范对接共享?

8.能否实现动态、高效、灵活、有规则的对外数据开放?

9.全域的数据资源标准是否规范一致?各项数据的含义、分类、技术标准、应用条件等说明是否明晰统一?

10.数据资源质量评价与共享、运营绩效评估能否便捷开展?

11.数据采集管道是否高效复用,数据质量关卡前移与下沉,确保应采尽采,一数一源?

12数据资源如何转化为数据资产,政务数据能否持续生长、循环利用与不断增值,从数据仓库演变成数据工厂?

-------更多问题


(四)亟待提升数据管理成熟度

植入基因,夯实基础,规范建设。加强城市数据中心管理与应用系统的标准化建设,积极应用政务大数据基因系统,严格数据资源梳理、数据清单制定、元数据标准化管理、数据资源目录管理以及信息资源库架构管理等流程,真正发挥城市数据中心作用。

目标导向,以评促建,提升能力。城市数据管理成熟度评估让城市数据管理阶段目标更明确。每个城市对数据建设的重视程度与所处阶段都是不同的,不同阶段城市数据管理建设路径不一致。城市数据管理从影响因素等若干维度进行全面的评估。

表1 城市数据管理成熟度评估指标


一级指标 二级指标
数据战略 战略规划
组织架构
战略实施
制度建设
效益评估
数据架构 数据模型
数据分布
数据交换共享
数据目录
元数据管理
数据标准 业务术语
参考数据和主数据标准
数据元标准
数据质量
数据应用 数据分析
开放共享
数据服务
数据安全 安全策略
安全保障
安全审计

根据城市数据管理的现状,通过采用资料收集、调查问卷、座谈会等手段完成,通过现状调研达到以下目标:

根据城市的数据管理现状,分数据战略、数据架构、数据标准、数据应用等几个专题分别进行打分,形成城市数据管理能力的雷达图,发现城市数据建设现阶段的不足,提供解决思路。

从多角度若干维度调查城市数据现状并编写城市数据管理发展水平评估报告,提升管理能级。


数据管理体系架构与五要素

(一)数据管理体系架构

(二)数据管理五要素

1.制度化:实现制度创新与机构赋能

建立城市数据管理的组织架构,一般数据管理组织机构的主要职责为:研究拟订并组织实施大数据战略、规划和政策措施;协调、组织实施国家和地方数据标准,研究拟订信息资源交换共享目录、技术规范和范围;组织制定数据采集、管理、开放、应用等标准规范;负责统筹城市信息网络体系、数据中心的建设、管理等。

管理制度是保障,制度数据管理办法和认责划分,结合城市数据管理的现状,为城市数据管理的开展提供有据可依的管理办法、规定数据管理的业务流程、责任划分等规章制度政策等。

2.清单化:实现数据体系完整详细

建立全域数据资产清单,清晰、动态、直观的掌控全局,了解当前城市数据资源体系情况,使城市各单位既掌握本单位信息资源,又能了解城市其他部门资源情况。

数据资产按照不同分类进行划分,部门类、主题类、基础类,通过资源体系清晰地了解每个部门数据资源情况,哪些数据字段已交换共享、哪些数据已经开放,哪些数据没有开放,避免各部门“扯皮”现象的发生。

3.标准化:通过数据元标准提升数据质量

元数据管理能够增强数据理解,架起城市业务与技术之间的一座桥梁。目前城市很少能完整地拿出一套关于城市各类数据的业务含义、口径、技术标准、分布情况等的说明,使用元数据管理可以加强对数据业务含义的理解,帮助理解数据,增加分析的敏捷性。通过元数据管理还可以针对内外部的数据需求,快速建立业务与技术之间的衔接,为城市数据管理提供重要的保障。

数据元标准提供了一整套规范,目的是为了业务人员、技术人员在提到一个词时有规范、清晰的含义。数据元标准以业务数据为出发点,经过详细的数据调研、访谈、设计、评审等严格的标准定义流程。

4.智能化:创新政府数据模型设计

随着城市信息化程度的不断深入,跨业务、跨部门的应用需求越来越迫切,对具有共性的数据,人口数据、法人数据等帮助城市构建单一、准确、权威的数据来源。

对城市的核心数据提供数据模型实体、属性及其关系,对城市运营管理和管理过程中涉及到的业务概念和逻辑规则进行统一定义。

5.价值化:数据开放驱动服务创新

无论是数据交换还是数据开放,其最终目标是充分挖掘数据价值。因此城市数据建设,要深刻理解大数据对城市治理的意义,并贯彻在整个数据建设的各个过程中。提升城市大数据技术服务能力,促进大数据与各行业应用的深度融合,以应用带动大数据技术和产品研发,形成面向各行业的成熟的大数据解决方案,为城市治理提供更有效的决策支持和运营服务。


数据基因系统(GD-DNA)重塑城市数据管理体系


概念内涵

数据基因是指基于数据元和元数据的标准化编码基础上可实现数据自由编辑、抽取、复制和关联应用的核心密码体系。它是实现数据跨系统共享交换、创新应用的底层逻辑和关键规则。

政务大数据基因系统是按照国家、行业和地方标准,通过政务数据元、元数据标准化和数据模板化实现数据规范编辑、智能管理、关联应用和共享开放,以提升全域数据资源活化和管理能级。它是实现数据跨系统共享交换、创新应用的底层逻辑和关键规则体系,是解决(大)数据混杂、提升数据质量、促进数据创新应用的前提,也是集成信息资源目录体系、交换体系和开放体系三合一的管理平台,为优化政务数据体系、探索数据关系、驱动数据服务奠定基础。是城市和行业数据中心的必备管理工具,实现从管网络、系统到管用数据的跃迁。

(二)系统架构

(三)系统五大功能

1. 信息资源模板生成

围绕基础类、主题类、部门类提供数据元、信息资源模板制作、导入、生成功能,对比筛选出城市核心业务部门的核心业务的信息资源作为整个系统核心数据元、信息资源模板,通过模板的生成,在信息资源目录管理中能够快速架构部门的资源体系。

2. 数据元标准化管理

围绕信息资源采集需求,筛选出各部门共性、关键的主数据,建立涉及核心数据的字段池,对字段的命名、格式、长度等属性进行规范,依托数据元池进行信息资源信息项的编目,严格控制新增字段,实现共性数据元的统一标准规范。

3. 信息资源目录管理

提供机房、服务器、存储器、应用系统清单管理,实现清单化管理;提供元数据管理,实现信息资源、数据元目录的自定义配置;提供信息资源注册、发布、审核、注销等功能;提供目录浏览、检索服务,实现主题词、分类、信息资源代码等检索;提供资源服务,实现共享、需求申请;提供资源统计服务,按照不同维度实现信息资源、数据元的统计分析。

4. 信息资源模型设计

提供资源库模型设计功能,为城市基础数据库、主题库建设提供支撑,实现自主设计城市资源库结构、信息资源关联、库结构的展示及导出等功能。

5. 信息资源关联分析

提供数据元的频率分析、同义词分析、关联分析等功能,频率分析统计某个数据元的各个部门、信息资源使用频率,分析数据元之间同类项之间关系,同时对部门、信息资源数据元之间的关联进行分析。

(四)系统特点与价值

系统特点

1. 快速架构

本系统提供强大的政务数据元、信息资源的模板库,通过模板库各单位可直接导出数据元、信息资源模板,以直接沿用或是自定义修改的方式对模板进行选择性的编目,达到各部门政务信息资源快速梳理、信息资源体系快速架构的目标。

2. 整体解决

本系统为城市信息资源从采集、存储、使用提供全生命周期的标准化服务,围绕信息资源采集需求,筛选出各部门共性、关键的主数据,建立涉及核心数据的字段池,通过数据元池的构建,实现底层数据字段的标准化,为城市信息资源的交换共享提供支撑。

3. 智能管理

本系统提供智能化配置服务,根据城市实际需求,可自定义设计数据元、信息资源的目录元数据,自配置相关选择字段的字典,同时本系统提供相关基础库、主题的模型设计功能,实现不同应用场景下,通过信息资源的组合构建应用模型,围绕构建的模型可以实现快速构建应用系统数据表结构设计。

4. 一揽子服务

本系统从信息资源业务出发,围绕信息资源业务及相应的软硬件,构建城市信息资产清单,定位业务—信息资源—应用系统—服务器—机房(云)。同时结合信息资源提供梳理服务、标准规范制定、绩效考核指标设计等系列咨询服务。


系统价值

1. 解决数据体系底层核心问题

不同部门之间共享信息资源面临信息源多头采集,重复采集,数据命名、类型、格式差异,部门间的数据定义不一致,技术路线多样化等问题,本系统是针对城市资源库结构的规范管理,对信息资源的核心字段进行标准化,是城市基础库、主题库及相应应用系统表结构设计的基础,使各部门在信息化建设中能够做到有章可循、标准统一,避免出现信息混乱、数据孤岛等现象,从底层上解决问题。

2. 提升政府数据资源管理能级

本系统通过对元数据、数据元、信息资源、业务信息进行动态化管理,实现城市信息资源按照分类规范、数据元标准、元数据标准等进行实时管理,实现城市对信息资源管理的动态化、精准化、全面化、账目化,通过本系统能清晰、动态、直观的掌握城市数据资源全局情况。

3. 促进政府信息资源开放共享

本系统通过全面梳理城市信息资源,实现信息资源的清单化管理,搭建用户与系统、系统与业务、系统与系统之间信息沟通的桥梁,有助于解决数据权属问题,避免各部门“扯皮”,实现城市各单位能快速清晰掌握整个城市的信息资源情况,为实现信息资源的交换共享开放提供支撑。

4. 实现政府数据驱动服务创新

围绕基础类、主题类、部门类的信息资源体系,自主设计基础库、各类主题的应用模型,有助于实现基于数据元的基础上进行灵活的数据抽取,促进跨部门系统的数据集成,快速构建应用系统表结构设计,实现不同场景下新应用服务。


四、产品服务体系

服务体系

服务体系 服务要点 主要服务内容
目录管理服务 提供信息资源梳理工具,快速构建和管理目录体系
实现信息资源目录的信息采集、注册、发布、审核、更新、修订等。
实现信息资源目录编码、关键字设置、主题词设置等。
实现政务信息资源目录及相关信息的展现、定制检索与全文检索、查找、订阅等。
供信息资源清单化管理
提供机房、服务器、存储器、应用系统清单管理,实现清单化管理。
能够全景动态直观的展示城市信息资源体系结构。
实现用户与系统、系统与业务、系统与系统之间信息关联。
全域模板服务



部门数据元、信息资源模板
提供政府核心部门主要业务涉及的核心数据元、信息资源模板。
基础库主数据模板
梳理出涉及人口库、法人库、信用库、证照库等核心数据模板。
主题库主数据模板
围绕主题工程、公共服务事项等梳理出该主题的主数据模板。
定制化模板
根据现状调研,按需求进行自服务、定制一套适用于本地模板。
数据元标准化服务
信息资源信息项的编目、主数据规范
围绕信息资源采集需求,筛选出各部门共性、关键的主数据,建立涉及核心数据的字段池。
规范字段的命名、格式、长度等属性。
依托数据元池进行信息资源信息项的编目,严格控制新增字段,实现共性数据元的统一标准规范。
自定义配置服务

目录元数据配置
提供核心元数据、扩展元数据管理,根据城市管理的实际需求,自定义资源目录表单。
目录字典配置
实现相关表单的选择填写,结合相关标准和实际情况,所有选项均可通过系统字典进行配置。

应用场景模型构建服务

基础库模型
为城市基础数据库、主题库建设提供支撑,实现自主设计城市资源库结构、信息资源关联、库结构的展示及导出等功能。
自定义模型
根据各部门业务需求,通过信息资源组合,构建不同场景模型。
统计分析服务

统计服务
提供各部门信息资源、数据元数量统计情况,提供各部门信息资源、数据元共享、开放的情况。
关联分析
提供数据元的频率分析、同义词分析、关联分析等功能,频率分析统计某个数据元的各个部门、信息资源使用频率。
分析数据元之间同类项之间关系。
分析部门、信息资源数据元之间的关联。
智能匹配服务
数据元、信息资源自动匹配和增加
可将各单位应用系统的表结构直接导入本系统,通过配置可实现数据元、信息资源的自动匹配和增加,为快速实现应用系统信息资源清单化、目录化提供支撑。


五、典型案例

(一)战略设计层面

1. 佛山市——数据银行规划

提出数据银行体系的构建理念,管理层面,建立一套完善的数据生命周期管理制度,制定全域统一数据规范和标准,技术层面,通过改进现有数据共享平台技术缺陷等,以逐步完成数据银行的各系统功能建设。

(二)业务梳理层面

1. 河北省——城市主题信息资源梳理

主题信息资源梳理,城市管理梳理,对城市建筑物情况、城市部件、市容管理、城市绿化管理等资源进行梳理;社会救助梳理 ,对最低生活保障、医疗救助、教育救助、住房救助、就业救助、临时救助等资源进行梳理。

2. 南宁市——全市信息资源目录体系建设

业务梳理与应用系统数据梳理两者相结合,通过业务和应用系统的对比,最终得出全市82个部门数据资源清单,根据最终梳理情况,发布南宁城市信息资源发展概况分析,配合资源目录系统开发,实现最终目录与目录系统的对接。

3. 舟山市—全市数据资产清单建立

建立了“四统一、两清单”,以业务梳理为核心,从业务事项——信息资源——应用系统的顺序进行梳理,建立全市55个部门的“数据资产清单”和“基础数据库的资产清单”,围绕数据资产清单进行应用系统的云化迁移和

4. 徐汇区——基础数据库资源体系建设

从与部门核心业务和数据相关的已建应用系统和数据库入手进行资源梳理,与核心业务相关的已建应用系统入手,最后推导到相关业务事项。

5. 普陀区——公共服务事项梳理 建设

编制《公共服务事项目录清单》,以公共服务公平、可及为目标,对全区公共服务事项进行全面梳理,梳理内容细分为办理类和非办理类(单位名录类、场馆信息类、普通信息类)。

(三)保障运营层面

1. 佛山市——公共数据资源管理绩效指标体系

建立佛山市公共数据资源管理绩效评估指标体系,分为区(县)、市直经济和社会管理类单位和市委单位综合管理类单位三套指标,指标体系分别从数据摸底、数据统筹、数据应用、数据管控四大类进行绩效考核,通过以评促建、以评促改、以评促用、以评促管的良好局面,加强公共数据资源的综合规划和统筹共享,促进全域数据资源的横向整合和增值应用。

2. 舟山市——民生基础信息数据标准和交换规范

建立民生基础信息数据标准和交换实施规范,分为数据元目录与交换实施规范,数据元目录规定了民生信息中常用术语和分类要求、相关代码,规范了民生信息的最小数据单元及其描述方法。数据元目录是民生信息的基础,从数据的最小单元的角度规范了民生信息数据,为上层的数据交换提供了必要条件。交换实施规范规定了民生基础信息的数据交换要求,是民生基础信息在不同的系统之间进行传递时须遵守的交换格式要求,是系统之间进行信息交换的应用协议。