北京798一幢白色建筑的二层,整齐摆放着数十排数据服务器,这是中国最大的电信中立互联网基础设施服务提供商—世纪互联数据中心。这家公司目前管理超过1.4万个数据服务器,为超过2000家客户提供信息存储,包括百度、阿里巴巴、腾讯、360、京东、中央电视台等等。假设按照每台服务器存储数据位相同估算,世纪互联数据中心拥有的1.4万个数据服务器的信息存贮量为24拍(PB:Petabyte拍字节,1PB=1024TB)。
一个国家或者全球的数据拥有量的统计方法,是根据统计数据存贮中心(Data Center)服务器存储的数据总量。根据至顶-云技术第一门户数据中心发表的《2013:硬件重构与软件定义》报告,中国现有保存下来的数据容量大约在5EB(Exabyte艾字节,1EB=1024PB)左右,目前有300万台以上的服务器运行;而全球目前运行的服务器总量超过5000万台,美国运行的服务器总体容量接近1000万台。虽然中国是互联网、计算机、手机使用人数的世界第一大国,但中国的服务器不及美国的1/3。根据麦肯锡全球研究院IDC(Internet Data Center)互联网数据中心存储报告分析,2010年中国新增数据量为250拍,日本为400拍,而欧洲为2000拍,北美主要是美国为3500拍。
在中国,被保存下来的5EB数据分属媒体、互联网公司、政府部门以及电信企业、以及金融、教育、制造、服务业各部门部分,各占据5EB 的1/3。处于大数据时代,人们对知识资产大数据的价值评估提升,开始把数据称作新财富,其价值堪比石油。基于对数据商业机会以及决策支持进一步的理解,一场从未有过的跨越政商界限的掘金游戏在全球上演。
企业有理由守护企业的数据财富。互联网公司与电商花了大力气以及大价钱收集的数据,似乎有理由不向全社会无偿提供。以阿里淘宝为代表的电商们,基于后台强大的统计分析功能收集大量用户的行为特征,根据用户之前的购买行为、浏览行为、商品关联以及时间线预测,使用“猜你喜欢”向你推荐商品,这种关联规则的数据挖掘,使电商清晰地认识用户需求,时时追踪3.02亿的网上消费者。
目前取得的共识是,在所存储的数据中,中央政府各部门、地方政府以及履行公共服务职能的机构与企业所占据的1/3数据,是所有信息当中质量最高的,这是由政府社会管理职能所决定的。如统计、税收、预算、土地、就业、空气质量、治安,乃至公共图书馆、道路状况等等。
纵观大数据时代的社会公众,这是信息拥有与消费不平等的时代。国家、企业、个人三者扮演的角色与处境,自然人是获取信息能力最低也最不容易使用信息的“弱势群体”。事实上,公众成为互联网公司与电商时时跟踪的小白鼠,同时,他们无时无刻不向政府机构提供个人信息,从出生开始,各种登记纷至沓来,户口、学籍、婚姻到税收不一而足;此外,公民还有义务配合全国人口普查,故意不配合者,要受到《行政处罚法》的处罚。
普通公众在大数据时代除了在社交网络留下“垃圾信息制造者”(Spammers)的名声之外,我们还能获得需要的信息吗?人们是否有权利要求政府公开原本属于全体人民的数据呢?
申请政府信息公开的困境与异化
“政府信息公开像是一口大钟,要有人去撞它才会响。”这种政府与社会特定人群点对点的关系和一对一的回应,其交互成本非常高,正是由于获得政府公开信息的不易性,事实上压抑了人们对“知的需求”。
答案是肯定的。2007年1月17日,国务院第165次常务会议通过公布《中华人民共和国政府信息公开条例》,普通公众向政府申请信息,被称为“信息公开”。这项条例具有打造透明政府的进步意义,不仅使政务公开有了法律依据,而且为公众获得知情权提供了法律保障。政府信息公开条例实施后,从中央政府各部门到地方政府网站都设有“信息公开”专栏,并受理公众申请政府信息,也会不定期地公布《政府信息公开年度报告》。公众真的能向政府要来你所需要的信息吗?
如今已经在山东省一家建筑公司工作的清华大学学生李燕,2011年在清华读硕士研究生,为做论文,曾向十三部委申请公开相关副部长的分工职责等信息(这13个部门没有主动公开上述信息),她的要求以各种理由被拒绝。为此,李燕把拒绝公开信息的国土资源部、教育部及科技部告上法庭。在法院等多方努力下,科技部通过电子邮件回复了她“副部长分管部门、兼职状况及负责联系的单位”等信息,教育部、国土部也先后在其官方网站公开了副职信息。李燕最终撤回起诉书。李燕说:“政府信息公开像是一口大钟,要有人去撞它才会响。”
三年过去了。21世纪经济报道记者向两政府部门申请信息公开,尝试“撞”一下政府信息公开这口“钟”。首先是国家统计局,记者5月27日在其门户网站申请信息公开,在“所需信息的内容描述”与“所需信息的用途”栏中,记者写道:希望得到“全国第六次人口普查的财政预算预结算信息”,用于“新闻报道”。同一天在首都之窗-北京市政务门户网站,记者亦向北京市政府申请信息公开,受理机关为北京市信访办;所需的政府信息特征描述是:2013 年信访办接受来信来访的数量,以及来信来访前三位的分类状况。
自5月27日发出两份申请后,6月3日,记者首先接到国家统计局依申请公开受理部门的电话回访,核实记者的基本信息,并说要与相关司局沟通,之后给予答复。6月17日,记者收到国家统计局邮件,告知将延迟答复。邮件说:根据《中华人民共和国政府信息公开条例》规定(收到申请之日起15个工作日内予以答复),我局应当自6月17日之前做出答复,现因无法按期答复,经我局政府信息公开工作机构负责人同意,将延期答复,最长不超过15个工作日。
7月8日,发出两份申请的第30个工作日,也是统计局告知延期答复的最后一个工作日,记者终于收到了署名为国家统计局统计资料管理中心的《政府信息公开告知书》,其中写道:“经查,你申请获取的信息属于公开范围。”告知书罗列了中央财政、投资安排的三部分经费,同时表示,地方政府也安排了必要的人口普查经费,但这属于地方政府的事权。如记者需要这方面的数据,建议直接向各省市区相关部门询问。
而北京市政府信访办则直到6月27日也一直没有任何回复,经电话沟通,对方回复说:没有收到申请,理由是可能在垃圾邮件内没有看到。
现实生活中又有多少人为了获得一个信息或者一个数据,要走一套严格的程序,以及等待一个多月的漫长时间呢?这种政府与社会特定人群点对点的关系和一对一的回应,其交互成本非常高,正是由于获得政府公开信息的不易性,事实上压抑了人们对“知的需求”。
21世纪经济报道记者收集了国务院25个部委2013年申报信息公开件数,排除涉密的国家安全部和国防部外,收到申请信息公开件数上千件的只有国土资源部和环保部,分别是2258件与1076件,其余21个部委均在千件以下,不足百件的有12个部门,最少的是国家民委和文化部,全年只收到信息申请13和12件(见图2)。
国土资源部收到申请信息公开件名列第一并不奇怪,依据对省、市、县三级政府所收到的信息公开统计观察,规划与建设部门收到的信息公开申请量最大。中国政法大学宪法学与行政法学教授王敬波告诉记者,目前政府信息公开已经陷入异化的困境,申请信息公开正在成为信访的第二部门。
“一些长期信访户成为信息公开的主力军,其中多半都与拆迁有关。人们申请政府拆迁决定书、拆迁经费的拨付、领导的批示、会议纪要等等。当人们的信访诉求得不到回应时,转而申请政府信息公开,甚至有个别省份的人一次申请上千个信息,或者是几百个人聚集在一起申请信息公开,上访者把信息公开变成与政府斗智斗勇的手段了。也有人向政府申请历史信息,比如社会主义改造期间的信息,等等,所申请信息范畴是现行制度体系框架内难以满足的。” 王敬波对记者说。
当政府正在迈向公共信息开放,前进于促进人民的知情权和实现人民监督权的路途上,却万万没有想到,一些人把满足知情权的政府公开信息,绑在了与利益诉求与保障的战车上。而信息公开并不承担利益诉求与个体的利益保障。这使原本刚刚上路的信息公开面临新的困境。
大规模开放政府信息的隐痛
一些“戴帽”项目在建的过程中,可能必要的手续都不完备,现在要政府拿出这些信息,首先是政府部门可能就没有,其次是拿出去将不利于政府形象。当一个人家里没有收拾整齐的时候,是不好意思请人到家中做客的。
理解政府信息公开有两个重要的基本概念,一是公开,二是发布,相比较点对点的信息公开,信息发布是将信息或者文件“广而告知”,是政府点对应社会面的关系。目前,就信息发布而言,各级政府每年都在增加信息发布的数量。以收到申请信息公开件数最多的国土资源部为例,2013年,国土资源部门户网站共发布各类信息1.6万余条(2012年共发布国土资源信息6.4万余条,土地市场、矿业权市场集成发布公告公示类信息50万余条),应该说,政府信息主动公开信息量不小。但是人们最关心的征地信息,比如征地范围,补偿标准与安置等信息发布供给不足。
是什么原因让拥有较高质量的政府数据,不能转化为社会提高生产力的催化剂?归纳有三个问题:首先是行政分割导致人为壁垒,部门利益把自己所掌握的数据和信息作为部门独享财富和“传家宝”;其次是各种数据支离破碎,很多数据甚至没有经过整理,更无从谈建立数据库,导致数据的可用性非常低。最后是信息保密范围的界定不清晰。
前不久,江苏省中北部某市市委宣传部负责人对记者讲述了一个数据的故事:因该市产业定位要大力发展文化产业,所以需要查阅当地所有文化产业企业的基本情况。为了收集数据内容,宣传部门与包括统计局、财政局、税务局、工商局和文化局五个政府部门沟通,结果令人沮丧。统计局称,因为统计内部的部门划分原因,没有单独的相关数据,而是分散在三大产业之中,如果需要查阅,必须单独整理,将有关情况手动剥离出来,但也无法确保完整性;财政局称,没有掌握有关数据,应该在税务部门手中;而税务局称,其内部操作的相关数据,按照有关规定,无法提供;工商局称,他们只有企业的基本情况,而没有跟踪的财务数据;文化局虽然有相关的企业名录,却没有具体的企业数据。于是,该市宣传部门只能将从上述政府部门收集到的数据基础上,进行加工整理,即便如此,也只是个基本情况,既不全面也不完整。
这个案例在基本层面反映了目前中国政府数据碎片化的状态。自2000年全面推行电子政务以来,各级政府都建立了政府网站[以省以下行政区划单位统计(不含港澳台),全国共有34个省级行政区,333个地级行政区划单位,以及2856个县级行政区划单位]。但是,“每个政府部门建的系统,都是你建你的,他建他的,并且独立封闭运行,政府部门之间无法共享也不能分享(信息),也缺少不同级别的政府间纵向合作,在某一辖区内的政府间部门也没有建立横向的合作,各级政府部门后台信息的统一性严重缺位。”清华大学电子政务实验室主任孟庆国教授说。
部门间的数据整合之难是有先例的。2006年,北京市政府投资3000万元人民币推行市民卡,这是一张集合缴纳水电费、社保、公交出行及银行支付等的多功能卡,北京市经信委曾设想以此一卡,替代北京市民拥有的27张各种卡片。在试点时期发行了10万张卡,之后就没有下文了。这是个政府部门数据整合失败的案例。一张市民卡打破的不仅仅是政府部门间的数据分割,实质上触动了部门间的体制樊篱。北京市经信委主任张伯旭曾对媒体说,“技术(实现)上已经不是问题,目前的问题在于卡的后台服务是分离的,卡具、结算等都是独立的,所以解决问题不在卡片身上,而是在资源整合上。”
所谓政府的数据,说到底是部门的数据,各级部门掌握着大量的基础信息,但也仅仅是完整数据链条的一个结点。如果仅仅开放数据的几个点或者几个环节,断裂的或者分割的数据不能共享或者未经过整合,谈不上是高质量的数据。
人们可以留意大多数政府门户网,目前所公开的信息大多是规范性文件,比如政策法规、各种规定,以及部门领导人的讲话。“比如涉及到商业领域的招标,人们可以查到办事部门、流程、依据与结果,但是唯独缺少招标与政府采购的动态信息。总体来讲,政府的文件或者是静态信息容易获得,信息量也比较丰富;而动态的会议或者决策的过程基本上没有。”孟庆国说。
政法大学教授王敬波把政府信息公开比喻为是政府自己揭自己的盖子。她说:“信息公开实质上是政府全流程行为的反映。在政府的运作当中,原来政府如何干、怎么干都是自己的内部的事情,一旦信息公开意味着把政府置于公众全视野范围下。政府一方面希望推进信息公开;一方面随着信息公开深度的增强,受到政府自身治理水平的困扰,目前政府的行政管理,无论是规范与制度化程度都达不到信息公开的要求。”
比如在快速经济发展当中政府有些行为不是那样规范,比如“绿色通道”、“特事特办”,这些“戴帽”项目在建的过程中,可能必要的手续都不完备,现在信息公开要政府拿出这些信息,首先是政府部门可能就没有,其次是拿出去将不利于政府形象。当一个人家里没有收拾整齐的时候,是不好意思请人到家中做客的。
中国从1999年开始实施“政府上网工程”,到2000年电子政务全面推行,以及2006年国家信息化发展战略颁布,信息公开经历了三个阶段。孟庆国评价我国电子政务发展成绩与不足时说,“各级政府门户网站体系基本形成,政府信息内容建设与服务取得显著成绩,政府业务应用系统建设推进顺利,电子政务基础性工作和应用能力明显增强。但是存在不足,主要是信息资源管理和建设存在体制性障碍,业务系统水平低,应用和服务不深入等等。尽管实施政府电子政务已有15年,每年的投入约有3000亿元人民币,总体来看,投资的边际效用比较低,电子政务水平的各项指标世界排位都比较低,与中国经济总量世界第二位极不相称。”
2013年全球竞争力排行榜,综合竞争力中国内地排名第21位,其中政府效能排位第41名,技术设施第20位,教育设施第40位。而根据《2012年联合国电子政府调查报告》数据显示,中国在全球电子政府发展排名第78位,前五名是韩国、荷兰、英国、丹麦与美国。上述数据显示,目前与服务型政府改革的目标还有很大差距。
依法划定数据保密与开放的边界
“身处大数据时代,遇到两个方面的矛盾,一个是国家安全需要更多的国家信息的保密,一个是信息公开是大的趋势。但现实是,我们两边都不靠,该保的密也没保住,该公开的信息也没公开。”
当年清华学生李燕向13部委申请公开“各副部长分管部门、兼职状况及负责联系的单位”等信息,教育部等单位拒绝公开的理由是:所申请的属于我部机关在日常工作中制作的内部管理信息,且与您的特殊需要无关,根据《政府信息公开条例》和《国务院办公厅关于实施〈条例〉若干问题的意见》(国办发[2008]36号)及其他文件规定,一般不属于政府信息公开的范围。
至于“其他文件”是什么文件,教育部工作人员称这是一个“内部规定”,具体的文件名称和文号均不能告知。
公众依《条例》申请政府信息公开不容易, 除了所谓的“内部规定”之外,更多的是遇到行政机关屡屡以申请公开的信息属于国家秘密、个人隐私等公开的“例外事项”为由拒绝公开。国务院各部委信息公开的年报显示,有关政府数据公开申请处理结果中,确有因“涉及国家秘密依法不予公开”的记录。比如公安部,2013年在对有关受理的政府信息公开申请处理意见时,在243件信息公开申请中,有50件“不属于政府信息公开范围”,有11件是“涉及国家秘密依法不予公开”的。
当前,与现行《信息公开条例》之间有交叉的有《保守国家秘密法》和《档案法》两个法律,后两者是国家的大法,而《信息公开条例》属于行政法规范畴。在我国,按照宪法和立法法规定的立法体制,法律位阶共分六级,它们从高到低依次是根本法、基本法、普通法、行政法规和地方性法规和行政规章。显然,《信息公开条例》的法律位阶低于《保守国家秘密法》和《档案法》,下位阶的法律应该服从上位阶的法律。这就使得对“国家秘密”等例外事项的判断必须依赖于《保密法》等法律法规,甚至是各级行政机关的规范性文件。行政机关有可能通过制定规范性文件的方式扩大不公开范围,公开例外事项的范围实际上处于极不确定的状态。
但是,在法学专家王敬波教授看来,高低位阶的法律与法规相遭遇,更深层面反映的是政府运作体制与理念,是以公开为原则还是以保密为原则的问题。她说,“这是一个问题的两个方面,如果《保守国家秘密法》是国家大法,《信息公开条例》是第二位阶的,那两者根本不在一个层面上,所以政府机关当然优先遵守《保守国家秘密法》。但是,如果按照国家要治理现代化的标准来看,透明政府是标准之一,尤其是公共权利的运作规则,这两者在位阶上的差距实际上与原则是不相匹配的”。
为此,王敬波等法律专家们一直在呼吁制定《信息公开法》,以改变《信息公开条例》低位阶而不能承载信息公开的功能。王敬波教授承认,这项工作的推进有很大难度,短期内实现的可能性很小,目前也只限于学界的讨论中。但是她认为,当下可以做的是严密定义及限制《信息公开条例》“例外”的范围。
她介绍说,我国《政府信息公开条例》对例外事项的规定过于原则,《条例》的第十四条只规定了“行政机关不得公开涉及国家秘密、商业秘密、个人隐私的政府信息” 三项公开的例外事项,这三条不仅宽泛,还存在大量不确定概念,行政机关自由裁量权很大。从世界范围上来说,如果从公开是原则,不公开是例外的角度讲,对我国信息公开的例外事项需加以规范,“例外事项”必须用列举的方式,所谓列举就是要把不能公开的逐条例举,而且必须详尽,防止“例外事项”被扩大化解释。
在信息公开先行一步的西方国家,比如以英国为例,在其《信息自由法》中明确列举了25类可能免于公开的信息,并通过通关检验进一步判断某类信息是否可以不公开。其中,8类信息属于绝对例外,不需要进行相关评估;另外17类为相对例外,需要以信息本身是否适合公开为标准—如果能证明公开对公共利益的好处更大,则可能被公开。
“我们现在对信息公开的范围规定是有缺陷的。身处大数据时代,遇到两个方面的矛盾,一个是国家安全需要更多的国家信息的保密,一个是信息公开是大的趋势。但现实是,我们两边都不靠,该保的密也没保住,该公开的信息也没公开。”王敬波教授说。
中国大数据战略何时出台
从目前政府就有关应对大数据挑战与应战看,似乎只有“抢”的意识而没有“抢”的行动。我们是否已经为“抓住机遇”做好准备了?我们能否在大数据时代让自己“处在一个更有利的位置上?”
孟樸是世纪互联数据中心有限公司总裁,同时也是工信部电信经济专家委员会委员。该委员会的职能之一为工信部在通信、互联网及网络经济领域的公共决策提供支持。作为一家数据存储公司,他对美英等国家将“大数据战略”上升为国家战略层面的信息十分敏感:
奥巴马政府在2012年宣布投资2亿美元拉动大数据相关产业的发展;英国商业、创新和技能部在2013年年初也宣布,将注资6亿英镑发展8类高新技术,大数据独揽其中的1.89亿英镑。
面对世界主要发达国家都在大力发展大数据,力争在这一革命性领域取得领先位置的行动,当记者提出鉴于主要发达国家均制定了大数据发展战略,您是否认为中国政府制定此规划或者战略已经迫在眉睫?孟樸说,“答案是肯定的。”他认为:“大数据战略是美国政府自1993年制定信息高速公路国家战略之后的又一个国家战略。从上世纪60年代的数据处理,到70-80年代的信息应用,再到90年代的决策支持模型,进入2000年后的数据存储和挖掘,再就是今天的大数据。大部分与大数据相关的技术和分析应用是从2010年左右开始出现的,大数据时代正处于早期阶段或者发展初期。但是方向已经非常明确了,尽早从政府角度制定规划,会对我国信息化建设以及未来产业有重要的作用。”
遗憾的是,孟樸所在的工信部电信经济专家委员会至今没有把大数据列入会议讨论的日程。2013年第二季度会议的讨论议题是混合制经济、虚拟运营商与电信运营商的关系,之前所关注的问题是宽带、资费、电信改革等问题。最令他着急的是,目前尚没有听说那个部门着手研究或者制定大数据的国家战略。
为此,记者向工信部新闻处申请采访杨学山副部长,2014年5月8日他曾在清华大学大数据时代高端论坛发表“求真务实、凝聚合力、抢抓大数据发展机遇”的演讲。杨学山演讲时说道:“中国两百年来在物理领域的竞争落后了,在IT领域的竞争,直到今天为止,我们还是落后的。所以我们希望在数据领域的竞争中,即使我们现在落后,我们必须承认,但是我们在今天和现在抓住这个机遇,能使我们处在一个更有利的位置上。”
杨学山讲演的题目使用了一个动感很强的“抢”字引起记者的关注,这也是目前为止中国最高级别的官员公开专题谈论大数据。为此,记者希望向工信部求证:目前中国“十三五”国家发展规划已经进入前期研究阶段,关于大数据的国家发展战略是否应列入工信部的研究。特别要提到的是,2008年3月国家大部制改革不再保留国务院信息化工作办公室,根据《国务院关于机构设置的通知》,信息产业部和国务院信息化工作办公室的职责,统一纳入新成立的“工业和信息化部”,国家信息化领导小组的具体工作由工业和信息化部承担。
根据工信部的安排,工信部负责大数据问题的软件司汪存富博士给记者打电话。汪存富在电话中对记者说:目前我们正在做有关大数据的前期研究,主要是思路性的,可能会提出一些政策性建议,但是并没有上升到国家战略的层面。当记者提出是否可以进一步了解的时候,汪存富回答,在这个议题没有上部长会议之前,不方便接受记者的采访。至此推断,目前尚没有机构牵头就中国大数据的国家战略乃至发展规划做前期研究。
2014年5月17日,记者参加世界电信和信息社会日的会议,其主题是“宽带促进可持续发展”,显然这是国际电信联盟为发展中国家设置的议题,因为“宽带战略”在发达国家已经推演了近十年。而中国于2013年8月17日由国务院发布了“宽带中国”战略实施方案,宽带首次成为国家战略性公共基础设施,意味着“宽带战略”成为国家战略。
工信部总工程师张峰在电信日的会上透露,目前,中国“固定宽带接入用户达1.96亿户”,“固定宽带接入速率持续提升,8M以上宽带用户占比达25.7%,4M以上农村宽带用户占比达64.3%。这是相关部门连续3年组织实施“宽带普及提速工程”和“宽带中国专项行动”的结果。而此时,91%的美国人已接入下行速度超过10Mbps的有线宽带,81%的美国人正在使用相近速度的移动无线宽带。
从目前政府就有关应对大数据挑战与应战看,似乎只有“抢”的意识而没有“抢”的行动,我们是否已经为“抓住机遇”做好准备了?我们能否在大数据时代让自己“处在一个更有利的位置上”?
企业界与学术界显得分外焦急。2013年9月30日,百度CEO李彦宏一再坚持为包括习近平总书记在内的中央政治局常委介绍大数据;今年两会期间,李彦宏、雷军等政协委员的提案就是加快实施大数据的国家战略。李彦宏认为,大数据时代已经来临,大数据不仅是互联网企业的事,更应是国家的事,要从国家层面发展大数据,实施网络安全与信息化战略。
国家自然科学基金委管理学部冯芷艳处长向记者介绍,她正在组织有80多位多学科科学家参与的有关大数据基础研究的课题申请,这将是一个重大项目群,申请资金2亿元,涵盖商业领域、公共管理领域、经济领域以及信息科学, 研究范围从微观到中观再到宏观,包括医疗、教育、金融、商务、环境等领域。“我们也是希望在大数据研究中包括着国家的安全战略。”冯芷艳说。另外,国家社科基金重大项目在5月份已经提交“国家大数据战略”项目计划。
“大数据是一场革命,它对现有生产力和生产关系的影响是颠覆性的,这也许是目前正在进行的科技革命的新的发展阶段,也许甚至是下一次科技革命的前夜。只有将大数据的重要性放到如此的高度,制定大数据发展战略的重要性才能提升至国家层面。要在发展目标、发展原则、关键技术等方面做出顶层设计和规划,这个规划要涵盖大数据产业生态环境建设、行业标准制定、核心技术突破等。将大数据发展上升至国家战略层面,我国才能在这场技术革命中争取世界领先地位。”孟樸对记者说。(编辑 韩瑞芸 付玉)