建设“智慧发改”的总体框架,一个基本想法就是在底层要有一个智慧基础设施,如智能云中心、政务数据共享交换、安全防护等,在这之上建设一个智慧感知中心。这个智慧感知中心就是要围绕国家发改委的履职需要,把发改委内各种数据资源进行统筹整合,在发改委外跟相关部委、相关地方包括海外的各种数据进行归集和收集,形成一个一体化的数据体系。在这些数据之上建设一个智慧决策大脑,这个大脑要围绕发改委的核心职能,构建一系列的数据分析模型和业务模型,包括数据的自然语言处理、深度学习算法、多维数据关联、数据质量稽查、数据治理算法,还有数据清洗、数据调度、性能监控这样一些底层的数据平台。然后基于这些模型去形成面向决策的一些指标,比如消费升级、投资运行、“一带一路”、就业收入、价格、资源能源、军民融合、“双创”等领域的一些核心决策指标。这些指标生成之后,就把一些来自不同领域的非结构化数据给它结构化,变成一些决策能够使用的数据。在这个数据基础之上要支撑三个大的业务体系,一个叫智慧治理平台,就是国家发改委的综合办公、行政管理、宏观调控以及协同治理的一些系统建设,这些系统同时又会收集很多数据反哺给智慧大脑,然后基于这个大脑的数据为它的系统提供运行,是一个双向互动的关系。另一个是智慧服务窗口,就是发改委的门户网站,“两微一端”,包括政务服务综合平台这样的一些对外服务的窗口,也是和发改委内部的决策大脑是一体化的,有相连的这么一个机制。再一个是智慧展示系统。实际上是想规划建设一个智慧发改大厅,这个大厅通过可视化的方式形成大屏、中屏、小屏相结合的模式。所谓大屏就是要建设一个集中统一的可视化决策支持系统,来把发改委的核心业务,关注的重大政策、重大事件进行可视化展现,为领导决策所用。中屏就是把整个智慧大脑的模型和算法,推送到每个司局的业务终端,跟司局的核心业务相结合,以便更好地支撑司局工作。小屏就是开发一个叫“掌上发改”的功能,让全委的每个公务员人手一台智能终端,并通过这个智能终端把很多发改委关心的一些核心业务、重大事件、业务指标进行推送,提升发改委全体公务员履职的能力和水平。由此形成了一个以数据为核心,重构发改委业务决策和对外服务的行业监管职能体系,这就是当时提出的“智慧发改”的总体目标,叫作“六个智慧”。围绕这“六个智慧”的总体架构进行前期布局,目前已经取得了比较好的效果,包括以下几大方面。
1.智慧感知中心的建设。就是要形成一套全面、及时归集政务数据和社会数据的常态化的机制。它包括两个方面,第一就是在政务数据归集这方面,打造一个国家政务数据共享体系枢纽;第二是在政务数据归集基础之上,推进建设政务数据和社会数据平台化对接的方式。
(1)全力打造国家政务数据共享体系枢纽。这个枢纽的核心是基于国家信息中心的工作基础,比如说现在国家的电子政务外网已经形成了一个连接100%的省(自治区、直辖市)、90%的地市和80%的县的一个四级网络,横向联通了85个中央政府部门和相关单位,接入的终端超过了140多万台,是一个政务数据共享交换的高速公路。
在国家政务数据共享体系枢纽之上建设四大平台,这四大平台现在都取得了比较好的成效。一是国家信用信息交换平台,已整合36个部委,对接人民银行的金融监管数据,形成了信用信息共享汇聚的机制。二是投资项目并联审批监管平台,目前已经实现投资项目审批16个部委一并受理、并联审批、限时办结的机制,而且纵向连接到省市县各级。三是公共资源交易平台,整合了全国的两千多家公共资源交易平台,比如土地矿权、政府采购、工程承包这样的一些交易数据,为公共资源交易监管所使用。四是价格监管平台,形成了一个中央省市县四级联网的体系,每年受理的价格监管案件呈几何级数增长,并利用这些数据让发改委了解市场营商环境和市场环境。
从2017年8月开始,按照总体要求,发改委牵头建设国家政务数据共享交换平台,这个平台目前已经连接了72个部委和32个地方政府,累计接收的数据目录已经超过50多万条,实际上就是把全国各部委和省一级的政务数据目录进行整合,形成一体化的数据共享机制。另外正在推进立项的还有国家公共数据统计开放平台,就是把所归集的数据在可开放的前提下用安全可控的方式,面向社会公众和企业,开放一些数据来支撑企业的生产经营和公民个人的服务,形成一个共享与开放相结合的体系。
基于这些数据,国家发改委已经陆续和7个部委建立了跨部委的数据共享和业务协同机制,比如和税务总局、工商总局、质检总局等。和国家民委共建了“一带一路”民族文化大数据中心,围绕“一带一路”和民族文化共享数据资源,形成一些不同领域民族文化的数据归集和业务协同开发机制,服务国家的“一带一路”倡议。
发改委和国家税务总局有一个战略合作,就是共享企业的税收征管和纳税人服务,包括税收发票数据,并根据这些发票数据去分析企业的生产经营情况,为宏观决策所使用。再如发改委和国家质检总局的战略合作,主要是面向电商平台如阿里巴巴、京东、唯品会、1号店等商品的质量监管,包括对商品销售、网店数据等进行归集,然后基于这些数据形成面向电商领域的行业公共服务,为提升整个行业质量监管提供帮助。
(2)建立政务数据与社会数据平台化对接机制。主要是依托立项建设的国家发改委互联网大数据分析云平台这个架构,从底层的网络基础设施到物理硬件的云平台,到技术平台和算法引擎的一体化体系。然后建立一套面向互联网全网数据公开的汇聚机制,对一些企业的生产经营状况、就业招聘数据、专利数据、新闻、论坛、自媒体、电商、房地产、搜索引擎、卫星灯光等数据源,进行常态化收集。目前收集的数据已超过200亿条,形成了一个围绕发改委核心履职所使用的非常庞大的数据体系。
另外就是和一些企业建立数据共享和合作开发机制,共同为智能政务建设所用。现已经形成围绕发改委履职所需的一些常用数据200亿条、超过50个大项的数据体系,现很多研究和分析,就是基于这些数据去展开的。
2.智慧决策大脑的构建。这里也有两个问题,第一个叫数据治理,第二是构建动态本体分析机制。
(1)完善数据治理体系。实际上,数据归集后并不可用,有很多的数据是不干净甚至是杂乱无章的,必须对归集后的数据进行清洗,形成对于数据质量一体化管理控制的一套体系来完善数据治理的方法。如数据的采集,人们知道很多数据采回来时只是一些文本信息,也包括政府的内部文件文本,把这些文本转化为一个能够为计算机所理解的结构化信息,是需要做工作的。其中有一个很重要的技术叫事件抽取技术,比如采集了上市公告这么一条信息,里边就涵盖了企业名称、企业股本、上市时间、证券代码、证券简称等信息,这些字段需要通过自然语言处理的方法把它给抽取出来,才会成为一个真正可用的数据体系,也就是说要进行命名主体识别,这是第一个要做的也是非常关键的事情。
第二个要做的事情就是机器的自动纠偏。互联网数据实际上是一个很杂乱的体系,有很多数据是虚假的甚至是相互矛盾的,比如说现在抓回来一条就业招聘的数据,前面会告诉说这个职位有相应的要求,比如要有五年以上的工作经验,相关的专业、年龄这样一些信息,但是在下面其他要求里,它又显示说这个工作经验、学历要求、专业、年龄都是不限的,实际上在同一页面里的信息会出现一些相互矛盾的问题,在采集数据的时候就需要通过一些算法的设计,能够智能识别这些问题,然后自动进行纠偏,把这些错误信息甚至是虚假信息抽取出来进行清洗和处理,这样数据质量才相对比较可控一些。
发改委之前做的一个研究,就是12358价格监管平台,这个平台有一类数据后来发现问题很大,就是有很多所谓的职业举报人,专门依靠发现一些商品的问题,通过这个网站进行举报,举报之后要求商家进行赔偿,通过这个赔偿来赚钱,实际上是用这种方式去牟利的一群人,他们的行为会导致这个平台上的很多举报数据失真,因为它并不是真实的市场营商环境的反映,而是个人的行为。那么这个时候就需要开发一套算法,对这个职业举报人的特征进行构建,比如里边举报的文本长度,提及的各种法律法规的条数,时间的格式,网址,订单号,甚至是问号、叹号,包括用语习惯等进行建模分析,通过机器学习的方法去识别这些职业举报人,发现可以达到98%的识别准确率,识别出来之后剩下的信息才是我们认为相对比较可靠、比较正确的一些数据,所以这里就涉及质量管控的问题,需要对数据进行加工和处理,这样整个数据质量才能够满足监管的要求。
(2)构建动态本体分析机制。什么是动态本体呢?一个人也好,或者一个企业也好,或者是一个事件也好,我们可以把它认为是一个本体。只要是本体,它就有自己的一些属性,有主体之间的相互关联。把所采集的数据按照这样一个动态本体的方式进行抽象,通过一些属性把这些个人和企业进行一些描述和刻画,这样就能够通过一个数据体系,从最微观的层面对这个事件进行分析,然后进行推演,再从这个事件开始一步一步回溯还原,变成一个宏观的态势改变,这就提出了一个理念叫作宏观运行的微观化,也就是说把宏观经济的分析,建立在最微观的主体信息的构建和识别基础之上来进行研究,这就是动态本体模型的构建,应用它就可以确保我们的整个监测运行是及时可控的。(www.xing528.com)
另一个就是多数据源综合研判体系的构建。比如说自然人和法人,自然人有很多信息,如他的籍贯、行为轨迹、消费记录、网络浏览记录,一些行为偏好等维度,通过不同的网络进行关联,在多种网络之间去做综合比对来帮助我们发现问题。法人的数据也是同样的原理,通过这种关联就可以发现,比如一些关键的风险路径怎么去进行识别,然后对一些产业运行的结构性特点进行分析,对一些核心的风险主体进行识别和防控。另外就是有很多企业的跨域行为,比如跨省投资或者说跨省的股权并购行为等,都可以通过这种关联进行一些分析识别出来,然后帮助我们去分析这个区域时空关联网络的衍变。
再有就是事中事后监管工作。在这个基础之上,我们现在构建了一个叫全国企业生产经营行为的一个大数据平台,虽然还在建设,但这个平台现已经达到了500亿以上的数据规模。在这个平台里,期望把全国的7000万家企业和个体工商户的工商注册、社会信用、就业招聘、招投标、投融资、专利软件著作、行政审批、法院判决等78大类、1800多个指标,按照企业ID号进行统一检索,以同一个企业的维度,把这个企业生产经营方方面面的信息进行整合和打通,对企业按照行业、按照地域、按照属性去进行灵活的划分,细分之后对其运行情况进行跟踪和分析研判,这样就会发现一些热点。
比如分析大数据或者区块链这样一个新兴行业的运行情况。区块链是虚拟货币比特币的底层技术,它在本质上是一个分布式、去中心化的数据库,就像是一个开放的网络账本,在比特币的交易中,交易记录的全部信息会被打包到一个“区块”中进行储存,区块之间相互链接,就形成了区块链,而每次交易都会对网络里所有的参与者进行广播,经确认后会被记录到所有参与者的账本中,区块链上所有的信息都是共享的、透明的,当虚假信息发生时,就会通过相互对证来破除,从而保证网络安全。区块链去中心化的特点是无须依赖第三方,其运作不需要任何人为干预,同时网络向全世界开放,未来可用于跨境支付、证券、贷款、电子商务等领域。
我们只需要把企业生产经营范围里涉及区块链的这些企业抽取出来,然后对这些企业招聘、就业的各种情况进行分析,就可以做到对于行业运行情况一个非常精准、非常及时的研判。
基于这样的一套数据体系,目前发改委也构建了一些大数据指标库,包括五个大类、两百多个指标,包含了宏观经济研判、“供给侧”结构性改革、“一带一路”、京津冀一体化和长江经济带这样一些指数。发改委和重庆市政府有关部门,也在合作开发一些比如重庆市的长江经济带运行情况、营商环境、政务服务的效能等,这些指数实际上也能够帮助我们去更好地提升政府治理的水平。
在开发指数之外的一个很重要的工作,就是报告工作体系的构建,从需求反馈、业务建模、数据抓取、数据分析和报告撰写,形成了一个72小时响应的机制,就是在72小时之内可以实现从最早的一个需求提出,到最后数据分析报告形成的一个全流程。
围绕国家发改委的需求,已经形成了和12个司局有常态化支撑服务的机制,同时提供的数据分析报告已经覆盖了发改委超过90%的业务司局,也就是现在发改委所有的业务都已经实现了数据化,就是用数据来说话,用数据来进行决策,用数据来进行服务。
从2016年开始,发改委也尝试在地方建设一些区域的分中心,目前已在大连、杭州、海南、重庆建设了4个分中心,其中重庆分中心建设的进展比较快,现已有国家发改委大数据中心的重庆分中心和“一带一路”大数据中心的西部分中心落地,并归集了十几亿条的数据,向重庆市委市政府提交了十几期的大数据分析报告。目前正在注册成立重庆西部大数据前沿应用研究院这样一个智库实体,将来会在重庆有一个专门的研究团队来服务重庆市政府的决策需求。另外发改委最近还会和福建省、雄安新区签署两个战略合作协议,进而在全国形成六个区的分中心相互支撑的格局,一个基本的理念就是要把国家的数据和地方的数据进行打通,帮助地方去提升政府治理的水平,把很多数据为政府决策所用,把很多分析方法、分析模型分享给地方,然后帮助地方宏观部门提升它们的决策能力。
图灵奖得主吉姆·格雷提出了科学研究四范式理论,其中第四范式“数据密集型科学”就是对海量数据进行分析总结,得到理论。在政府治理领域同样如此,国家发改委率先垂范,研究出许多分析方法和模型,帮助地方政府提升决策能力,同时也把智能政务提升到了一个新的水平。
学习与反思:
1.新技术的快速发展对政府治理提出了哪些挑战?
2.政府治理经历了哪三个历史阶段?各个阶段的主要特点是什么?
3.如何理解国家发改委提出的“智慧发改”建设?
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。