探索中国CIO人才现状 | 第四季调研报告
大数据时代:休眠沉睡的政府数据看不着、查不到
2016-07-11  来源:e行网

长期分散在各个政府部门的各项数据“各吃各饭”“各管一摊”,休眠沉睡。一边是看不着、查不到,一边是握在手、落满土——大数据时代,诸多政府数据面临着如此尴尬。如何唤醒政府数据?这一大数据时代之问,已经成为社会的重要关切。

政府数据像是穿着“隐身衣”

“很繁琐。”面对半月谈记者的采访,长春一名硕士研究生王贺说,因研究需要,他要查阅省内县市七八十年代的经济发展数据,包括GDP增速、人均收入增速等。

“这些数据县里都有,提供起来难度也不大。”王贺说,“但一些地方此类数据并未数字化,需要一家一家咨询,写申请、打报告,来回折腾下来,几天时间都算快的。”王贺的论文撰写进度,基本上取决于数据的反馈速度。

和王贺一样,吉林财经大学教授祝国平也经常会遇到“数据困境”:省级、市级统计信息网站上各项数据齐全,可要不是搜索引擎时常“抽风”,关键字搜索后显示页面空白,要不就是干脆没有搜索功能,全靠肉眼从大量链接中找寻目标信息。

不少高校研究人员表示,数据收集查询有时更像是体力活,单靠个人工作量极大,只能学生老师“齐上阵”。

费时费力查阅到相关数据还好,还有不少政府数据像是穿着“隐身衣”,难以找到。吉林云耕农业公司是一家利用土壤数据进行农产品种植的创业企业。“通过数据精准分析,农产品耕种效率更高,食品安全能得到有效保障。”企业负责人王丽英说。但企业在与有关部门协调使用一些土壤肥力、黑土含量数据时困难重重。“只能自力更生,组建测量团队在田间地头定点查验。”王丽英说,“如果政府数据能够共享,我们就能将更多精力放在数据库建设、数据挖掘上。”

“用不好”也是政府数据休眠的一大表现。以居民家庭日常接触的水电、燃气费用为例,地市相关企业有着一整套缴费、使用数据。“如果能统一归集,建立长期模型,就能为每户家庭制作出消耗图表,进行节能、错峰使用指导。”北京市民秦乙天说。然而,国内这样做的城市并不多。

“小区改造,一星期内同一处路面开挖了三四次。”山西大同市民郭利说,“燃气、网络、下水……来一队人马,挖一道沟,就不能将数据互通有无,一次性搞定吗?”郭利的疑问,在许多城市普遍存在,难共享的数据让路面成了创可贴。

数据鸿沟催生数据休眠

采访中,许多专家表示,国内具有价值的公共数据大都散落于各个政府部门,其中国土、公安、农业、统计等占据其中大半,不仅单项数据价值巨大,多重数据的整合开发,更能发挥出乘数效应。

数据黄金为何难采?规则标准滞后、服务意识欠缺、协调平台缺位……多种因素作用之下,数据休眠也就不足为奇。

——政府数据公开缺乏有针对性的法规细则。目前各地进行政府信息公开的主要依据是《中华人民共和国政府信息公开条例》,但有专家指出,条例主要针对政府各类行政许可、发展规划、统计信息等,数据公开着墨不多。不仅如此,条例对公开的规定较为宏观,缺乏细则,成为一些部门驳回数据公开申请的理由。

——政府服务意识缺乏,让数据公开难上加难。“上级部门没要求公开”、“数据放出去害怕产生不良影响”、“数据开放又不是硬性规定”……在记者采访中,这样的说辞和心态普遍存在。东北师范大学传播学教授金振邦认为,“多一事不如少一事”的心态,是政府数据公开的“拦路虎”。“事不关己”的态度,不仅让政府数据沉睡,还把想叫醒它们的人挡在门外。“本来有现成的,还得费时费力重新采集,真可惜。”王丽英说。

——数据公布方式、数据载体依然较为“原始”。在各地统计局等数据大户的网站上查询,word文档、PDF文档是最常见的数据载体,文字、数据、图表混合,提取有效信息像是大海捞针。反观一些市场化数据库,查询者只需登入,简单搜索就能满载而归。

——数据共享平台建设缺位,“信息孤岛”现象普遍。一些政府部门顾忌公众监督、审批权限等,部门数据不仅难以对公众公开,相关部门之间也难以相互查询,形成信息孤岛。“以农村金融征信平台建设为例,各家金融机构都有自己的一套体系,相互整合难度颇高,每家都能为农户进行信用画像,但并不全面。”祝国平说。

在许多专家看来,获取、建模、运算、优化……一系列大数据使用流程下,数据量需求越来越大,而数据入口大门紧闭,让这一切都无从谈起。

“掘金”政府数据亟待出实招

按照大数据理论,运算模型越复杂、维度越多,需要的数据量就越大。缺少数据支撑的模型迭代速度非常慢,模型优化也就更加不易。

在数据公开模式上,国内不少地方都进行了探索。北京市建立的政务数据资源网,目前已经公布了数百个数据包,涉及旅游、教育、医疗等。上海浦东市场监管局也将政府掌握的食品安全信息与网络订餐平台对接,向全社会开放共享。在吉林,吉林省金融办、人民银行长春中心支行以及吉林省农联社研发集征信、整理、分析为一体的数据库,构建立足于县市镇村的征信系统。“许多地方政府已经认识到手中数据的价值,这是个好现象。”吉林大学哲学社会学院教授田毅鹏说。

数据开放不是技术问题,而是意识问题。从政府角度看,“管理”意识强过“服务”意识,让不少申请数据公开的企业吃了闭门羹。此外,大量数据公开后,政府可能面临更多的公众监督压力。上海金融与法律研究院研究员聂日明撰文指出,如果将政府掌握的道路交通流量、交通事故等数据以接口形式定期发布,专业人士在此基础上的研究势必对城市、道路规划等方面提出批评和建议。

压力就是动力。企业开发利用数据,绕不开政府。“有了政府支持,我们才能有米下锅。”长春一位数据网络平台负责人建议,设立政府数据“负面清单”,将涉密、敏感数据归集在内,倒逼政府提高服务意识。

针对政府数据公开使用的立法,能够更严格明确政府、企业等主体的权利义务。“可以硬性规定地方政府出台相关条例、细则,一方面减少政府部门的顾忌,另一方面也能让市场主体与政府合作时有据可依。”田毅鹏说。

“数据掘金”要跨部门、跨区域整合。专家建议,在政务、交通、医疗等重点应用领域,可通过PPP等模式引入数据整理、加工专业机构先行先试,形成可复制经验后逐步推广。