高级检索

学术资源

行政法学

当前位置: 首页 -> 学术资源 -> 行政法学前沿 -> 行政法学 -> 正文

徐珉川:论公共数据开放的可信治理

信息来源:《比较法研究》2021年第6期 发布日期:2022-03-03

[摘 要]:智慧社会时代大规模智能化技术应用,离不开公共数据资源的社会化利用。而现有对公共数据的内部数据治理和外部风险规制,对于公共数据的开放而言,不论是在开放公共数据的可用性还是可追溯性层面上都存在局限。为保障公共数据开放的有序开展,有赖于在公共数据开放的动态化实践中,建立起相应的风险分配机制。通过动态化治理而非静态式规制,为公共数据开放的秩序提供一个可以信赖的制度环境,是形成公共数据持续稳定有序开放的关键。公共数据开放的可信治理,就是对公共数据开放秩序可信环境的塑造与维护。公共数据开放可信治理的规范性架构,可以通过公共数据内在信用基础和开放行为外在信任框架两个方面展开,分别从开放公共数据自身的信用保障和公共数据开放的信任交互关系建立两个层面入手。同时,借助于关键信息基础设施、代码规制方案和算法治理方法三种辅助治理工具的应用,赋予公共数据可信治理框架落实为可信治理行动的能力。

[关键词]:公共数据;开放秩序;数据治理;可信环境


数据的有序开放与规范利用,是推动公共数据内在价值实现的制度性前提。大数据驱动的人工智能技术在更加多样的业务场景中的深度应用,离不开高质量数据资源的支撑。根据国家大数据战略的精神,推动数据资源开放共享,进一步释放数据红利。推进社会整体的智能化应用水平,打破不同机构、不同领域间的数据藩篱,消除数据孤岛,已经成为推动国家和社会现代化建设的重要共识。中华人民共和国数据安全法(以下简称《数据安全法》)在立法原则条款中明确规定,在维护数据安全的同时,促进数据开发利用

不论是数字政府实践还是智慧社会建设,都建立在公共数据广泛汇集、交换和共享开放的基础之上。尽管现阶段数据传输、交换,已经能够获得相对成熟的技术保障。但是,数据流通机制的不健全,极大地制约了以大数据为基础的智能化应用成效。尤其是在制度层面,有关数据的大量基础性概念和规则,仍然存在许多短期内难以消减的理论、学说争议。在充满不确定性的制度环境中,如何进一步推动数据实践而不是被滞后的制度束缚,需要我们将关注点放到数据的实践活动之中。从全球范围看,新加坡个人数据保护机构于2019年年底发布了《可信数据共享框架》(Trusted Data Sharing Framework),而欧盟委员会在2020年年底也公布了《数据治理法案》(Data Governance Act, DGA)提案,作为欧盟数据战略规划中的第一项重要成果,其所要重点解决的正是数据开放秩序问题。为数据流通秩序提供规范上的框架性指导,已经成为数据治理领域中的高优先级问题。针对特定数据的流通,优先建立其运作的秩序框架,避免过多形而上的概念争论。我们的讨论也采用相似的立场,将对公共数据治理的关注转向公共数据开放过程中可信秩序的规范性框架指引。通过公共数据开放的可信治理,建立公共数据开放的可信赖秩序环境。


一、公共数据开放的治理问题

从政府信息依法公开到公共数据有序开放,本质上是公共信息资源配置的根本性变革。由政府信息透明转变为公共数据开放,不仅体现了数字政府实践所带来的社会治理理念革新,更表现为对公共数据资源价值挖掘与利用的秩序性追求。传统上,以政府信息公开为核心命题的数据信息规制路径,多依赖于单一行政法规范为主的调整方式。以限权督责为基本规范功能的行政法规则对公共信息公开行为的规制重心,在于检验并保障政府信息公开的具体行政行为应当具有合法性与正当性。

公共数据开放的数据治理很难延续相同的路径。公共数据作为社会生产的关键资源要素和价值载体的特性,使得公共数据资源一旦进入开放的环境之中,其价值实现和关联权益的规范性影响,在现有的以技术治理为主要内容的公共数据治理架构下将无法有效调控。规范层面的治理机制缺失,使得公共数据流通实践处于制度的真空之中,公共数据的控制者往往陷入到寸步难行或信马由缰的极端境地。而公共数据的流通活动缺少了秩序化的稳定状态,自然无法满足新时代智能社会对公共数据资源合理、充分利用的广泛需求。

公共数据治理的规范局限,应以相应的规范机制来加以克服。特别是在我国民法典对公民个人数据权益予以肯认,个人信息权益逐步得到系统保护,《数据安全法》将国家整体安全观引入数据实践这样的规范环境下,对与数字政府实践紧密关联的公共数据开放秩序的治理,也即是为公共数据开放行为提供规范性支撑。

(一)数字政府背景下的公共数据开放

所谓数字政府,就是借助前沿科技手段,回应社会变迁和技术发展双重需求的新型治理理念。但是,随着全国各地数字政府建设持续推进并取得初步成效,公权力机关或公共机构在履行职务或者公共职责等公共性事务的活动中,积累了海量的公共数据。这一庞大的公共数据资源,在通过各地政务大数据中心为各种智能化政务应用提供公共数据支撑的同时,也不可避免地会遭遇到网络安全、数据安全和侵害个人信息权益等方面的风险的挑战。一旦毫无准备地将巨量公共数据放入开放环节,自然会引发公众对个人隐私权利以及个人信息权利的关注。可以看到,通过政务数据平台开展不同政务部门间公共数据的共享活动,是目前公共数据成为大数据并得到智能化利用的主要形式。而出于对数据安全以及个人信息权益侵害的法律风险的担心,各地政务数据主管机关往往只选择进行形式性的公共数据开放。即便确定了公共数据开放目录,也只是在非常有限的范围内进行开放,很多公共数据开放的形式和方法,依旧属于传统政府信息公开式的小数据开放,不具备充分的数据可用性。

作为关键性生产要素,公共数据在社会公共产品的供给体系中已经成为必需品。政府作为社会公共产品的主要供给方,在公共产品生产/再生产链条中处于主导性的地位。为社会提供公共数据产品,也即在保障国家安全、数据安全和公民个人合法权益的条件下,应当开放公共数据。但现阶段,无论是对不同类型的数据及其关联权益的法律性质的认识,还是对不同应用场景中涉及到的数据实践社会关系的调整方式,都尚处在理论探索阶段,如数据规范上的类型化认知,不同数据权益法律保护机制的选择等。个人数据、企业数据、公共数据在范围上既存在交叠又有所差异,个人数据上的权利与个人隐私、个人信息权益既有联系又存在区别,公共数据中政务机关控制的数据与公共性社会服务运营机构控制的数据之间的联系和区别等问题,都存在一定的争议。正因为数据上权益属于新兴权益,数据规范体系在现有历史条件下的滞后不完善,直接限制了公共数据资源开发利用的制度上动力。公共数据资源的开放利用与公共数据的数据安全要求及多方权益之间的紧张关系,是当前公共数据开放中必须面对的最突出矛盾,也当然应成为公共数据开放治理中的关键环节。

(二)公共数据内部可用性的治理局限

公共数据通常包括公共机构在依法履行行政职权和公共管理职能,或提供公共服务过程中,采集、生成并以一定形式加以记录、存储的各类数据资源。就面向智慧社会的社会治理总体要求而言,不论是公权力机构履职需要,还是公共产品供给需求,都离不开由公共数据提供的数据资源的支撑。至少就现阶段的人工智能技术能力和技术趋势而言,除了必要信息基础设施和软硬件环境支持以外,各个公共智能应用在落地实施时,都需要有可供利用的数据资源,以支持其相应的智能化功能。因此,在数字政府实践中,公共数据可用性的治理,更多倾向于追求功能性的目标。其主要的表现即是,在公共数据处理过程中,对数据的采集、存储、传输等环节,提供全生命周期的技术性保障。但是,政务智能化系统性能层面上的效果,属于数字政府建设成效的一部分。公共数据开放提出的是不同于政务智能应用利用公共数据时的可用性要求。

公共数据开放的可用性,是一种以促成秩序形成的信用建设效果为导向的评判。这就首先要求,公共数据的开放自身能够为开放秩序提供可以信赖的基础。从公共数据治理的微观层面来看,可以从公共数据的质量保障技术、安全管理架构等方面,为公共数据的可用性提供技术和管理上的支撑。转换为公共数据的特征化表述,即进入开放流通渠道的公共数据从数据质量的角度检视,应满足公共数据上所内含信息的真实性、一致性、及时性和安全性等形式上的数据可信要求(trusted data)。虽然在公共数据内部技术治理的范畴中,也包含类似的数据质量管理的要求,但是,不同于其内部治理的资产管理目标指向,公共数据开放中数据可用性的治理,更倾向于服务公共数据开放秩序的形成。因此,除了公共数据的标准化、规范化等技术层面的基础性技术保障外,公共数据开放的可用性,与利用公共数据开放资源的各个智能化系统所处领域的业务目标紧密相关。所有紧密结合业务领域的特定应用场景目标的智能化应用以及支持它们有效运作的公共数据资源,都有各自的场景化处理方式。对公共数据加以使用的具体行为的便利性,对特定公共数据开放利用可能关联的公共数据上他人合法权益的风险的调整,才是公共数据开放治理需要关注的问题。仅仅在公共数据的内部技术化治理层面上来等同公共数据开放的治理,至少在可用性和可追溯性两个方面存在局限。

其一,开放公共数据的可用性问题。公共数据开放的一般范围,可开放获取公共数据的可读取程度,以及公共数据获取的技术形式和使用方法等问题,直接影响开放公共数据是否能够以相对便利方式的获得。经开放提供的公共数据,能够符合开放服务需求者对数据质量的合理预期。这里涉及公共服务保障机制的细节问题,特别是与信息化相关的制度细节如何得到改善的问题。公共数据资源开放目录的确定以及及时的动态更新,开放公共数据的获取或者接入的申请方式及其时限等等具体制度都需要在开放治理的框架中加以协调。还有更加具体的问题,如在我国政府及公共机构推进信息化的过程中,大量建立在传统工业领域专业化软件基础上设计的业务系统,在人机交互的便利性方面存在明显短板。而公共性信息化系统很难做到完全的市场化竞争,也不太可能对已经完成建设的系统进行任意替换。那么,将具体公共数据开放活动中具体过程的运作情况,反馈到已有公共数据开放系统的运行机制中,依赖数据行政主管机关的自主行动是不够的。因此,在智能化应用运行的视角下,开放公共数据的可用性是同时关涉制度衔接、机构协调和公众互动等多层次的动态治理过程。

其二,开放公共数据的可追溯性问题。公共数据开放的主要对象以社会主体为主,这决定了开放条件下的公共数据的利用有着更高的复杂性。在公共数据内部数据治理目标的视野中,不论是行政机关的履职需要还是公共机构提供公共服务供给,对公共数据资源的利用均源于行政法律规范的强制性或授权性规则。而公共数据的开放性利用,则是智能技术在社会开放场景中对公共数据价值的深度挖掘。当然,开放利用公共数据在数据使用的合目的性和合法权益保障上,存在更多系统性风险。一方面是在公共数据开放的申请环节需要对社会主体利用开放公共数据的行为进行合法性控制;另一方面则是市场化运营的智能应用利用公共数据进行智能化决策,其引发的法律上的效果和责任会同时传递到开放的公共数据本身。这首先涉及到公共数据行政主管机关提供公共服务的职能及其权限问题,其次是对公共数据通过开放在完整智能化实践中应有的数据责任分配问题。但不论是对公共数据开放范围和权限的规制,还是以规范性调整为基础的法律责任划分,都呈现为技术与制度深度融合的综合调整机制。因此,公共数据开放可用性的完整保障机制,即是对公共数据资源上不同社会关系调整的规范性制度变革。

总之,公共数据开放的可用性保障,既包含公共数据资源内在的支撑技术和管理机制,也依赖于在规范层面提供对公共数据开放动态实践的治理机制。需要一套具备处理国家、社会及个人多元数据权益关系能力的规范性治理架构。

(三)公共数据外部风险的规制局限

数字政府亦是法治政府。公共数据的开放,当然也需要满足依法行政的要求。公共数据的治理,表征为工具理性与价值理性的有机结合。一旦我们将公共数据治理的任务目标,具体到开放公共数据使用的特定案例或者实施项目层面。那么在满足公共数据供给的社会性需求的同时,兼顾个人权益保障与数据合规就是公共数据开放将长期面对的规范性要求。公共数据开放行为,同时对应于公共机构、社会第三方、公民个人等多方主体各自不同的合规需要和权益诉求。在相对复杂的规范关系网络背景下,很难从整体上控制公共数据开放面临的潜在法律风险。

随着对数据资源价值认知程度的提高以及社会整体对个人隐私和个人信息保护的重视,各地政府在不断加强公共数据运用的同时,也在尽力通过制度化的方式规范公共数据处理活动。但主要集中聚焦于私法上权益调整方式的数据权益关系,很难从公共数据开放的风险规制角度为各方主体划定出清晰的行为界限。虽然公共数据在政务智能化应用中能够通过技术、管理手段建立相应的数据合规和数据安全机制来控制自身的风险。但是,在一个公共数据开放的整体秩序中,建立公共数据开放的关联各方都满足的风险规制的制度性要求,无异于各人自扫门前雪,本质上是一种责任竞争(责任推卸)机制,反而会导致公共数据合法开放使用活动的实践范围不清晰,公共数据使用的合理空间面临被挤压的风险。

缺少具体公共数据开放秩序的规范性指引作为运行依据,公共数据社会化应用必然面对未来数据实践中的不确定性。使用公共数据的潜在法律风险高企,反过来又会侵蚀政府对公共数据开放活动本身的信任基础,进而使政府倾向于采取过于严格的风险控制措施和自我限制,以规避公共数据开放活动中的不确定性所带来的经济及行政上的双重风险。这样,为了避免公共数据开放中的风险而设立的制度限制,必然影响公共数据开放的秩序化进程,降低公共数据资源利用的效率。

换一个角度看,通过数据的利用、再利用,深度挖掘数据的潜在价值,以预处理数据集、衍生数据集等数据产品形式实现数据资源共享,已成为信息技术产业的重要运营方式。通过公共数据开放吸纳社会组织或第三方机构参与社会治理,也是智慧社会建设重点探索的新型社会治理方式,更是消解传统行政制度中系统性信息壁垒、提升社会治理现代化水平的必由之路。公共数据的开放利用对于数字化社会治理显然必要,但也并非没有限度。问题的关键在于公共数据开放利用的合规要求及风险规制如何在开放实践中得到协调,促成公共数据开放秩序的形成。公共数据开放治理的目标,是提升公共数据开放利用的整体效率,将公共数据开放的风险规制成本分散到不同智能化应用的场景之中,从而优化开放利用的风险配置,也即是将公共数据开放中所存在的风险的简单化规制,转换为通过开放秩序建立公共数据开放中的风险分配机制。提升公共数据开放利用的规范化程度是一方面,促使公共数据开放过程中的各方主体主动参与消解公共数据开放的系统不确定性,使公共数据开放利用的整体风险处于可控状态,从而使得公共数据开放形成信任环境,才是公共数据开放治理的最终目标。


二、公共数据开放的可信秩序激励

公共数据开放面临的治理难题,源于公共数据开放实践层面存在规范失灵问题。局限于技术管理层面上的数据治理机制,与公共数据开放的秩序性要求不匹配,直接导致了规范失灵现象。

我们这里说的公共数据开放领域中的规范失灵,并非指现行的制度或者规则不具备规范性效力,而是指具体公共数据开放的规范制度缺少激励开放中各个主体自觉执行的动力。在缺少强制性规则或者完整责任规则的条件下,公共数据开放的传统规制机制,无法有效地实现规则本应具备的规范性功能,丧失了调整相应社会关系的能力。现实中的规范失灵,并不局限于单一形态,其具体表现同实践场景紧密相关。结合公共数据开放的实践语境,消解公共数据开放的规范失灵,也即是希望形成参与公共数据开放的各方主体自觉遵循公共数据开放中的各种标准规范、流程程序、资格资质、风险规制、合规监督等复杂的体系化制度性要求。显然,执行规则是需要成本的,试图依赖实践参与主体的道德自觉来遵守规则或者通过合作自主形成公共数据开放的秩序并不现实。因此,从规范性秩序的形成机理上说,需要提供支持规则运行的制度动力基础,这其中至少应当包含秩序的形成和秩序的维持两个方面的规范激励基础,

(一)公共数据开放的秩序生成动力

实践中,公共数据主要来源于公共性智能化系统运行过程中的数据生产。由于公共数据产生于行政机关或公共服务机构的具体业务活动之中,既有公民个人直接参与的环节,也包括各个具体行政部门履行行政职责的过程,而涉及公共数据开放利用的智能化系统处理的各项分析、预测、决策等与业务深度融合的处理,必然会同时关涉到公民个人与社会整体两类不同层级的权益架构。这就使得公共数据开放的实践常态,呈现出私人权利与公共利益高度竞合的状态。因此,与公共数据相关联的规范性问题固然复杂,但是消除了数据作为新兴客体带来的迷惑性表象,公共数据开放实践中的核心关切,依然是在以数据开放实践活动为基础的社会关系架构中寻求并维持各方权益的均衡。

在规范性的视野中,公共数据的开放过程形成相对稳定的权益均衡状态,也即是公共数据开放活动中形成稳定行为模式的过程,是行为主体对整体公共数据开放活动的秩序性追求。但一种社会秩序不会无中生有地自主生成。秩序本身是一种公共性制度产物,作为公共物品,公共数据开放中私主体的个体化行动,既不具备相应的能力也缺少充分的动力去组织并制度化相互间的交往关系。因此,从公共物品供给的角度来说,确定公共数据开放行为规则,并保证各方参与主体对该规则的执行,当然应属公权力机关公共职责的范畴。按照公共数据开放活动的数据流转过程,不同参与主体的角色配置形成了一种扁担式结构。

公共数据行政管理部门或公共数据中心作为公共数据资源汇聚和管理的中心,一方面对接作为公共数据生产者和初始控制者的各个政务部门;另一方面通过公共数据开放机制,对接公共数据的社会使用方。公共数据行政管理部门处于公共数据移转变动的核心节点,从公共数据技术治理的角度来说,其对各个政务部门负有数据治理的监督职权;从公共数据开放的风险规制角度来说,其对数据使用方特别是社会化使用方,负有相应的审查管理和合规监管的职责。这种行政管理的双重履职压力,对于公共数据行政管理部门来说,有两种压力纾解的策略。一种是官僚化的行政压力消解方式,即通过形式化的程序规则,将具体职责的履行行为,转换为各种资质、证明、说明、汇报文件的留存和审查,以文牍代替行动。显然,这不是一种具备可执行性的理想调整方法。而另一种减压途径则是法治的规范实践方式,这是一种更为可取的方式。对公共数据开放的活动建章立制,明确权责界线,构建行为准则,确定责任救济,以稳定其履职风险的预期。而这种制度化的行动方案形成了相应的秩序创制动力。

公共数据开放职责对公共数据行政管理部门来说,既是责任也是权力。就当前数据驱动的人工智能技术机理而言,智能化的实现,实际上是将原本依赖人类智力实现的信息提取、分析验证乃至判断决策,转换为数字化符号以纳入信息空间,并加以自动化处理的过程。在对数据缺少高效利用手段的条件下,人们难以获得行政主体决策和执行的充分信息。因此,传统的行政法规则对其行为的调整方式,更加倾向于将潜在风险的事前防范转换为具体行为的规范责任机制。而对大数据环境下公共数据资源利用的行为调整基本模式,已经转变为事前预防与事后救济相结合的形式。这种综合调整的规范形式,使得公共数据行政管理部门的治理监督和合规监管职权表现为对公共数据开放流通环节上下游的规制能力。在公共数据开放的具体活动中,每一次开放利用的需求都是场景化的个案需求,其实际操作流程也同时附带着相对高昂的制度成本。而公共数据行政管理部门基于其职权规制数据开放的上下游的具体活动,确保规范有序地开放公共数据,提高公共数据开放的效率,降低公共数据开放的执行成本。

(二)公共数据开放的可信环境激励

公共数据天然具有公共性价值,这决定了公共数据的开放明显区别于以私人权益主导的一般社会数据的利用。行政履职和公共服务供给,既是公权力回应公众对公共产品的需求,又体现公权力在国家制度框架中兑现社会公共服务供给的宪制承诺。当负载着公私多元信息价值的公共数据进入开放环境时,公共数据就作为生产要素进入社会生产/再生产领域,获得公共数据上数据价值再生产的能力。

从抽象层面看,与技术介入的过程同步,公共数据上相关联的社会关系,也会适应数据资产要素的特性进行重组,形成个人、公共机构、社会整体三者间新的社会关系。这个因技术性背景发生演变,进而将原有社会关系进行重构的过程,在一定程度上也可以视为是社会环境演变引发的原有社会关系的脱嵌效应[]经各个政务部门生产的公共数据,在经过公共数据中心的处理进入到开放环节之中,原公共数据上的社会性关联,在新建立的公共数据开放实践中发生了变化,一定程度上摆脱了原政务部门环境中公共数据上的关系形式。不论是脱敏处理后的样本集、算法训练后的模型参数,还是经由大数据分析生成的衍生数据,都脱离了原始公共数据条件下相关主体的认知和掌握。但是,社会性的脱嵌很难真正实现,以脱嵌为前提的制度设计必然会留下相应的制度真空,其真正影响无从推测也难以预计。因此,对应于变化后的社会关系调整,需要我们有相应的社会规范机制来加以填补。如果规范的制度性效果难以被有效地认知和评价,那么可行的替代性方案有两种,即或者依据经验数据进行风险预期并贴现,类似于物的担保;或者依据特定行为责任主体的责任承担能力,提供相应的承诺,类似于人的担保。简单来说,就是对可能出现的行为后果,权益相关方不依赖于直接因果的验证,而是对行为主体的信用加以检视。公共数据开放条件下的社会关系关联各方对公共数据上的信用基础加以检验,一经形成稳定预期,就能够形成公共数据开放的行为动力。

同时,在不断发展的新信息技术条件下,公共数据的潜在利用方式也自然可能同步发生变化,很难准确预测智能化技术应用对公共数据可能产生的潜在需求。这种源自传统行政系统外部的技术发展和运用,将会直接导致公共数据开放活动所涉及的关联规范关系的不确定。从这个角度看,公共数据使用所处实践环境的复杂性,进一步加深了公共数据开放的复杂性,既涉及到公民个人隐私、个人信息权益的保护规则,也关系着公共机构依法行使职权及公共数据采集、处理活动中各种公共数据的合规要求,还同时涉及到公共数据开放在数据流通上的规范标准与合规要求。在公共数据开放中,如果这些规范要求无法得到满足,必然会给公共数据的开放带来不确定性。法律规则滞后于社会实践,技术规范也当然落后于技术实践,这些都是规范性调整机制天然的局限。但是,从社会治理模式的演进来看,制度上的滞后性从来都不成为人们抛弃规范治理的理由,而依法治理也愈发成为社会总体治理的核心治理机制。究其缘由,除了法治本身就不是一种简单的静态僵化治理方案外,人们选择守法的更为主要的动力,来源于规范性机制为社会主体相互间交往提供的是一种可执行的信任环境。即便公共数据开放活动的各方主体由于自身掌握和处理信息的能力有限,而造成公共数据开放行为的信用基础不完善,规范体系的原则、规则体系以及个案判决也组成了一个对行为及其后果可以信赖的调整框架。即便最终在个案中可能会出现因具体规则本身的局限,而导致规范调整的效果有不尽完善之处。但是,参与到特定社会活动中的各方,都有理由相信大家是在相同的秩序条件下行为的,因此,对于各自的行为方式、行为选择过程中的风险分配机制以及出现争议后的责任承担和救济方法,有着大致相同的估计。

以当前法律规范提供的数据合规固有框架,是难以独立应对公共数据开放环节中多元社会关系复合化的调整需求的。以数据驱动为特征的技术应用形态,其运作机理决定了技术实践目标与公共数据利用方式之间的强耦合关系。面对技术引发的公共数据上新社会关系的不确定,以及规范引发的公共数据开放实践的不确定,需要基于公共数据开放的规范性治理框架来加以消解。公共数据开放往往同时涉及公共信息基础设施、信息资源管理利用、网络数据安全以及个人信息保护等多样化的治理层次和环节。软硬法结合、公私益交织,是公共数据开放治理所无法回避的混合实践环境。降低相应风险的规范机制的核心在于,将公共数据开放的实践置于调整并维持各方主体间信用关系的信任环境中,从而减少事前预防和事后救济的成本支出。


三、公共数据开放的可信秩序建构

公共数据开放的可信秩序,有助于参与到公共数据开放实践的各方主体自觉按照确定的标准、规范行动,并有动力执行规则、承担责任和寻求救济。同所有其他社会制度环境的运行机制一样,公共数据开放可信秩序的稳定可持续,取决于我们是否有行之有效的治理架构,以保障这种秩序环境得到相对稳定的维持。

(一)公共数据开放的可信治理机制

对公共数据开放的治理,需要针对公共数据的自身特征,以及开放环节的行为特点进行专门化的问题聚焦和回应性的规范设计。

首先,公共数据利用的高度场景化,决定了公共数据开放实践在具体执行中具有高度的个案化的特性。为公共数据的质量及其规范性提供的技术保障,很难通过直接套用通用技术得到实现。尽管原始数据的预处理技术已经有了很多年的发展,基础技术积累和特定数据处理问题的解决方案都已经较为成熟。但是,在公共数据开放的具体项目实施场景中,针对不同的业务目的、功能性任务需求和效果目标,具体公共数据资源的真实性、完整性及其规范性,依然是保证公共数据开放利用的功能性所无法回避的重要任务。

其次,公共数据开放的标准化程度,整体上依然处于较为初级的阶段。信息产业活动的内在特质,是将信息原型作为竞争的核心对象。现实中,政务部门各自开展数据实践,而参与到政务部门公共数据生产中的特定厂商或平台,对所控制的公共数据资源总是倾向于建立区隔,以巩固甚至增加自身在特定领域的数据竞争中所持有的数据优势,甚至形成对特定业务领域的公共数据垄断。虽然信息系统工程的招标方或者服务购买方,可以通过合同机制来限制厂商对公共数据资源的侵蚀,但各个政务部门受限于人力资源和专业知识,实际上不完全具备处理技术标准问题的能力,导致公共数据相关技术标准的制定,变成了不同厂商之间或明或暗的争斗角力。即便随着各种公共数据相关技术标准的陆续出台,逐渐走向成熟完善的各种数据相关标准体系在逐步填补数据规范空白的同时,今后也必然会产生提出标准规范的体系性、统一性、协调性的系统化治理需求。考虑到海量技术标准在内容和形式上所具有的复杂性,对它们的统筹管理也必然会形成公共数据开放中的相应治理需求。

再次,公共数据在现实的社会生活中,总是要以个人信息数据、原始数据、衍生数据等有着不同信息内容的具体数据形式来予以呈现。数据作为信息的价值载体,是人们从其中包含的信息获益的中介物。数据本身无法成为数据规制的规范性目标,而规则也无法直接从数据上识别出可以调整的社会关系。按照客体/对象二分的规范调整对象区分,数据在这个意义上更贴近于规则作用的对象,而不是规范调整的客体。因此,从有效实现规范调整的角度来看,只有那些能够将数据的内在信息价值加以兑现的数据活动或者数据行为,才是有关数据的各种社会关系建立的基础。因此,不论是数据权利/权益规则、数据交易规则、数据安全规则等有关数据的规范体系,首先关注的是数据活动及数据活动中社会不同利益主体之间互动所形成的社会关系。我们要建立公共数据开放活动的秩序,自然是围绕着公共数据开放行为,而不是公共数据本身来构建具体的制度架构。

当前我国各地积极推动的公共数据中心建设,在为公共数据资源储备以及进一步的流动交换准备技术性条件的同时,各个公共数据中心在运营中建立起的相关标准、指南和规范性文件,为公共数据开放奠定了可信赖的规范基础。但这还只是公共数据开放秩序所需的规范性治理结构整体的一小部分。有效的公共数据开放秩序的架构,需要从当前政府公共数据中心重点关注的技术标准、管理制度的静态规制形态,向公共数据开放的动态治理进行延伸。公共数据开放中具体数据行为的规范化管理包括数据合规框架设置、第三方权益侵害法律风险规避等具体问题,即公共数据流通涉及到的信任秩序要求,也要纳入公共数据开放的治理架构之中。

作为生产要素的公共数据要从静态量化信息的呈现样态,转为大数据中及时更新、持续演化、不断汇聚并能够广泛传递的数据流。传统上公共数据的内部治理结构,更偏向于静态稳定状态规制的制度解决方案。这种以技术标准化和管理规范化为基本制度要素的数据治理,面对公共数据流通秩序中更高的灵活性调整要求,就显得过于刻板。针对公共数据流通秩序的规范性关注,公共数据开放的治理框架,应当提供更加灵活的数据治理方案。这种治理方案,需要从公共数据内部数据的质量管理的框架中延伸出来,将公共数据流通秩序作为其规范视野中同等重要的治理要素。同时,综合质量控制、合规管理和风险防范的综合性治理结构,从而形成包含公共数据内在信用基础和公共数据流通的外部信任环境两个主要方面的公共数据开放可信治理体系。

(二)公共数据开放的可信治理框架

随着我国民法典和个人信息保护法的施行,无限制地收集个人信息的数据掠夺时期已经结束,对开放性信息空间中数据的过度爬取,特别是个人信息的过度采集,将受到法律严格的规制。公共数据开放则处在另一个不同的实践背景中。公共数据中的数据获取,多源于公共机构在履行法定职责或者提供公共服务的过程中,其合法性和正当性在一定程度上可以通过公共部门各自的数据合规管理机制来予以调整,因此在本质上能够转化为典型的行政法规范问题。但是,公共数据汇集后的进一步的开放活动,则涉及到不同行政层级、不同公共部门乃至于公共部门和私人部门之间的公共数据流转。公共数据的开放利用,也只有解决了各个政务部门在不同层级间、领域间的公共数据开放秩序问题,才能将其与公共数据中心或者公共数据开放平台对接起来,从而从整体上提升公共数据资源的利用价值和利用效率。虽然目前公共数据中心具有提供较为便捷的数据服务的能力,但从宏观上看,一种更为普遍化的公共数据开放仍然属于个案,规范化的公共数据开放依然没有真正形成规模。从今天智能社会建设大踏步发展的趋势看,智慧城市、智慧治理等智能化实践场景中技术应用对公共数据的依赖,已经形成公共数据开放的规模激励,我们需要为之准备的,就是维持公共数据开放秩序信任环境的规范框架。

1.公共数据开放的内在信用基础

数据相对于传统商品而言,显然是晚近出现的特殊存在。相对于传统民事法律关系中的有体物,数据是任何以电子或者其他方式对信息的记录。在这个意义上,物理世界中的数据,是作为抽象物而得到规范上认知的。但数据又区别于知识产权法所调整的抽象物。对于知识产权法而言,不论是著作权法调整的作品上权益分配、专利法对创新成果关联利益的配置,还是商标法针对商标专用权的确认,都更加关注蕴含在特定作品、技术/设计方案或者商标标识中的信息实质内容,其权利基础、控制范围以及权益实现,也都高度关联于这些信息实质内容在个案中的具体情况。

而数据是一种记录。即便我们从最宽泛的概念层面上观察,数据都表现为一种形式上信息内容的载体,其内在价值以对信息的记录方式和记录质量为核心关注。对比来看,数据权益的规则相对于知识产权规范,更多是针对固定下来的信息载体从形式层面进行调整的规则或者制度。比如对数据质量的要求,就是对数据所含有信息的真实性、一致性、规范性等信息记录表现方式上的要求。因此,尽管数据本身在社会历史中并不算是新鲜事物,但是技术变革引发了与数据相关联的社会关系的变革。互联网接入端口的高度普及、数据通信传输和存储能力的增强以及最为关键的硬件设备计算能力的提升,都为今天主要以电子化信息记录形式呈现的数据价值挖掘准备了条件。在大数据驱动下获得再一次爆发式发展的人工智能技术,进一步推动了数据的内在价值向更多元价值层次、更广泛社会关联的方向发展。也就是说,在智能化技术应用的场景中,数据的内在价值获得了纵深上的升级,智能技术能够直接触及贯穿数据、信息、知识和智慧的完整价值链条。

基于对公共数据内在价值利用的需要,公共数据自身应当在信息记载上的形式化要求,就进一步演变为智能技术应用条件下具有实质性使用价值的内在信用基础。公共数据质量上的要求,就转变为类似于情报科学或者信息管理领域中对公共信息生命周期管理的科学性要求。但两者的不同之处在于,情报信息管理制度并不必然要求某种专门规则的规范化调整。它们最终都会转化为保密信息、版权作品或者商业秘密等,以既有的特定法律形式来获得法律调整。而公共数据源自对原始公共信息的记录,其流通秩序上的要求依最终应用领域的不同场景,而表现为更加多元的、功能性的需求目标。在这个意义上,公共数据开放的信用基础,一方面包含有协调公共数据的获取方式、采集途径以及存储处理等方面的技术标准规范以及管理机制。另一方面保证公共数据开放实践中公共数据的接收方能够相信流通到智能应用系统中的公共数据资源具备可用性和可靠性。也即,政务部门的公共数据生产在数据格式规范化程度,数据传输可靠性程度,数据所含信息内容的完整性、一致性和真实性等方面,具备通过传统内部数据治理建立起来的信赖基础。

显然,试图获取公共数据的使用方实际上并不具备自我验证上述信赖基础的能力和权限。社会第三方主体需要借助公共数据开放机制所建立的信赖秩序进行背书,藉以验证初始公共数据的信赖基础。公共数据开放的治理要获得这种信用背书的能力,还同时需要为上述公共数据的内在信用特性提供相应公共数据信用基础可追溯的补救救济途径与责任界定方法,从而对进入到开放环境之中的公共数据提供规范上的信用承诺。

2.公共数据开放的外在信任框架

公共数据的开放依据其流通渠道性质的不同,可以分为数据使用的直接流通和市场化运营的中介流通。尽管公共数据权利及其权属等问题,属于公共数据开放利用的制度条件中非常重要的部分,也得到了理论和实践的高度重视,但是,如果从开放秩序的角度看,这只是在一定程度上解决了公共数据开放利用的合法性问题,而无法为公共数据开放行为提供有效的制度支撑。虽然数据权利的界定能够在一定程度上实现权利界定的清晰化,降低相应数据流转时的确权成本,为数据便捷流通提供制度基础,但这更多是建立在静态的制度观察的基础上。

如果说数据权利界定的清晰性有助于数据接收方在数据流通时获得稳定的效用预期,但是在公共数据开放的环境中,由于公共数据是基于公共职权或公共目的获取并生产的数据,其上混杂着个人信息、个人数据、公共业务数据以及在此基础上的衍生数据等多层次、多类型的数据形式。因此,即便是以后的立法界定了数据权利,明确了数据权属,也依然要处理公共数据资源在这种高度复杂数据条件下流通、使用的权限范围及相关个人同意、许可授权、再许可授权等高度碎片化的数据上权益协调机制。因此,对于公共数据开放实践而言,公共数据上的权属问题,只是开放公共数据的制度建构所涉及的公共数据内部信用基础中最抽象的那个部分。一旦进入到公共数据的实践中,它们又会重新转化为公共数据控制方对公共数据内在质量上的信用治理问题。

数据流转过程是一种动态的数据资源交换运行机制。公共数据通过开放实现公共数据资源流通,至少需要协调三对不同的公共数据资源控制者和利用者之间的相互信任关系问题:其一是作为个人数据来源的自然人与政府、公共机构之间的对个人数据采集的合法性信任。其二是不同层级和领域的政务部门通过公共数据中心建立起来的公共数据汇聚及共享渠道对规范化、合规化公共数据获取的信任。共享公共数据的目的,主要是任何政府机构在合规条件下能够获取跨层级、跨部门的公共数据资源,进行公共数据的再生产和再利用。共享公共数据的可信度,直接影响到再生产公共数据的信用基础。其三是在公共数据开放环节,作为公共数据资源持有者的政务部门或公共机构与开放利用公共数据资源的第三方主体之间的相互信任。

在公共数据使用的典型场景中,其信用能力首先源于公权力运行要求的履职尽责权限,但对公共性或者公益性公共数据使用秩序构成的挑战,更多表现为侵害第三方在先权益的潜在法律风险。而在完成基础性公共数据汇聚及相关预处理后,一般是通过公共数据中心开放渠道实现公共数据开放,由于对不同层级和部门的公共数据的具体情况无法直接进行全流程控制,因此公共数据开放的关键问题就转变为实际控制公共数据资源的不同机构对数据合规的管理,也即是对各公共数据控制方的公共数据合规框架的外部治理。这里的公共数据开放治理,既包括对相同领域的数据合规架构的协调,也包括相关机关对公共数据资源合规机制的管理、监督。最后,协调公共数据控制方与使用公共数据的社会第三方之间的信任关系,也即是公共数据开放涉及到公私两类不同主体之间的信任机制问题。除了双方各自的内部数据治理与数据合规管理外,最为关键的制度架构,是针对公共数据开放的方式建立支撑开放秩序中信任基础的规范结构。

近年来,数据信托(data trust)是一种较为引人注目的数据治理机制。数据信托的数据治理框架,通过引入民事规范中的信义义务,将民事规则嵌入数据流动的规范架构之中。这一公共数据规范架构,是公私法协同的社会风险治理理念的有益尝试。但数据信托也存在许多尚未解决的理论障碍,如数据可否作为信托财产的问题;高度分散和彼此独立的自然人作为个人数据所有者如何更加便捷地加入信托,并能够借助相应的责任机制和法律救济途径对受托方进行控制;公权力如何介入监管,以保证中介性数据受托方履行数据信义义务等,都还是未解的难题。在本文看来,将数据信托类比传统信托,可能是当前研究中存在的认识误区。至少从公共数据开放秩序的立场看,公共数据开放的秩序构建需要的是对开放活动的信任环境的维护,因此,单以信托这种特定的制度而论,并不能涵盖公共数据开放涉及到的公共数据自身的信用基础以及开放环节中各方主体之间的信任框架,因此很难形成信任秩序。与其说我们需要建立的规范框架是数据信托,不如说是针对公共数据开放的可信赖的秩序架构。也正因如此,公共数据的可信治理,才更切合较为完整的数据治理需求。

(三)公共数据开放的可信治理的治理工具

近年来,我国高度重视数据治理问题,颁布或者即将颁布一系列有关数据行为和数据权益的重要法律。数据立法已经成为当前立法部门立法工作的重点。随着各地数据条例或者公共数据条例相继出台,公共数据资源进一步开放和社会化利用将成为必然趋势。

与不断推进的立法实践相比,我国各地现阶段的公共数据开放,相对于较为理想的规模化公共数据开放利用,还存在不小差距。由于目前公共数据的治理方法主要还是集中在数据技术层面的技术性治理,以及公共数据有关活动的组织运行、政务部门间的职权责任划分等方面的管理规定,整体公共数据治理的架构还有待完善更新。公共数据管理部门对于政务部门之间的数据共享,普遍持宽容和积极态度,而对于数据向普通民众开放则持相对保守的态度。但是,随着民众对公共数据开放需求的进一步提升,各级公共数据行政管理机构未来必将面对公共数据开放实践中普遍存在的治理压力。在公共数据的开放中,如何实践公共数据开放的可信治理,本文认为可以从关键基础设施、代码规制方案和算法治理方法方面构建辅助治理的技术框架,重点推动这三个方面的辅助性创新技术的应用,通过综合技术应用、规章制度和法律规则三种要素,落实公共数据可信治理的行动。

第一,可信治理的关键基础设施。关键基础设施的概念起源于公共安全领域,特别是在网络信息安全保障中,对涉及到国家重大利益、国计民生保障、社会总体运行秩序等方面的重要的、关键性的基础支撑设施和设备,需要提供更为全面的保护,从而避免社会遭遇大规模、系统性的安全风险。随着新基建理念的提出,大数据时代的关键信息基础设施范围得到了拓展。其中最为重要的变化是数据和数据利用相关的基础性支撑设施,被纳入关键基础设施所涵盖的范畴,甚至特定数据集/数据库也可以被直接视为关键基础设施。公共数据作为国家、社会中涉及面广泛、价值含量较高的数据资源,应当被归于关键基础设施的范畴。从制度设计的层面上讲,划定支持公共数据开放的关键基础设施,就是在更高层级的整体安全观条件下建立保障公共数据开放的实践条件。因此,为了保障公共数据资源的内在价值不易贬损,同时建立相应的信任基础,对公共数据自身质量层面上的可用性,以及对公共数据质量可追溯的责任认定提供辅助方法,可以利用以区块链为代表的技术措施来加以实现。区块链简单来说,就是综合了加密方法、共识机制、分布式数据库等多项技术的一种信任/信用生产结构。其技术框架所具备的特点决定了区块链关联技术在防篡改、可追溯等信任能力建设方面具有较好的应用效果。利用区块链的技术特点,对公共数据本身的信用状态及开放数据流动的运行过程进行赋码并上链,将其流通状态和演变过程置于较为开放的公共数据通信网络环境下,实现网络中分布信息的可信留痕和固定。具体技术的实现方法本文不多论,但是近期公共数据开放实践中,已经出现了多例公共数据开放利用的创新方法,其基础技术支撑中均大量涉及区块链技术。从辅助验证并高效界定公共数据内在信用基础的视角来看,区块链及其关联技术是我们可以重点考虑的关键基础设施。

第二,可信治理的代码规制方案。代码即法律,在互联网条件下的公共数据开放实践,很难脱离代码化的环境来讨论治理问题。更重要的是,由于智能化技术的发展,以数据为对象的实践活动在高度智能化系统的支撑下,其行动表现也已经转变为代码行为。在这个意义上,规制代码就是规制行为。就公共数据开放的外在信任框架的要求来说,为公共数据开放建立具备可信赖秩序的信任环境,需要在开放实践中将信任问题落实为具体公共数据开放行为的合规保障规则和执行这些规则的程序性方案。同时,特定公共数据开放项目的实施执行方案,还需要具备防范网络安全和数据安全风险的能力,并在一定程度上具备保障公民在公共数据中的隐私权与个人信息权益的能力。从客观上来说,消除一切风险的绝对安全是无法实现的。人工智能技术中关键模型参数的训练大多依赖数据驱动的技术方案。消解数据安全和个人隐私、个人信息侵害风险在当前技术条件下最可取的辅助方法就是尽可能减少原始公共数据的直接流动。共享数据价值,而不共享数据,由区块链应用结合多方安全计算(secure multi-party computation)、联邦学习以及可信计算等技术方法,在一定范围上达到数据可用不可见的效果。这并不是说数据不可见就拒绝了公共数据开放,实际上数据价值的传递形式,最终也还是会以数据的方式来呈现。针对公共数据开放中存在的安全风险与权益保障需求,可以在规范性治理调整的基础上同时辅助代码规制方案加以实现。

当然,从公共数据开放的可信架构的体系化来看,可信赖秩序的生成,并不是单一技术就能够完成的任务。可以补充的一点是,在当前以公共数据行政管理部门为主导的公共数据开放制度背景下,公共行政部门作为公共数据资源的主要管理者和内部信用基础的治理方,主要承担公共数据活动的管理监督职责。在实施公共数据社会化开放项目时,由主管部门直接运作可能存在运营能力不足、寻租风险较高以及责任界分不明等问题。因此,可以通过设立公共数据再利用的中介机制,以公权力授权具备相应运营资质和充分技术能力的可信中介的方式来进行运作。如《上海市数据条例》拟采用的特许授权运营模式,或近一段时间备受关注的公共数据信托模式,由中介机构具体执行公共数据的社会化开放服务,并由其承担相应的信用责任,从而实现公共数据开放的可信治理。

第三,可信治理的算法治理方法。对于公共数据开放的外在信任框架而言,现阶段的公共数据开放中关联他人合法权益侵害风险的重点问题,主要涉及个人隐私权和个人信息权益保护的规范要求。除了公共数据的使用方通过隐私协议的方式,在制度层面建立自我承诺机制以外,为公共数据的开放利用行为提供一种事前预防的技术辅助方案,已经成为当前隐私保护的新型方法。随着人工智能技术应用的深入,内含于人工智能技术底层的算法所带来的各类问题,已经得到了广泛的重视。由于算法是一组针对某个具体问题的可执行的步骤,因而其在具体的自动化执行、自动化决策等算法输出行为上,当然可能引致相应的对第三方权益侵害的后果。因此,在算法行为层面突破技术中立原则而追及到算法设计者或者使用者的责任机制,并不能当然消解其中关涉的算法伦理和算法治理问题。这里就需要对利用开放公共数据的智能化算法加以治理,在算法自身的设计架构中补充相关的规范要素。通过基于设计隐私的算法治理,即通过将相关隐私规则代码化,使隐私权保护及个人信息权益保障的规则嵌入到人工智能算法的设计框架之中,在公共数据开放利用中属于技术底层的维度上,辅助实现公共数据开放的可信治理。具体实施方式是,可以由公共数据管理部门要求申请公共数据开放服务的第三方,向运营公共数据开放的中介机构提供具备隐私设计能力的技术资质证明,提交算法设计中关于设计隐私的具体方案,并由中介机构或第三方对算法中的设计隐私部分加以评估;结合具体公共数据开放的实施项目场景,来判断利用公共数据的特定算法是否满足了可信治理的要求。


四、结语

公共数据开放可信治理的核心命题,是建立负责任的开放公共数据使用的秩序环境,塑造公共数据开放流通的信任秩序,即通过数据开放相关规范上的治理框架建构,使数据使用者更加负责任地对待其利用数据的数据政策、运行措施和人员行为,主动维护数据关联第三方的合法权益,从而建立起公共数据资源生产/再生产的可持续循环。

概言之,公共数据开放的可信治理,可以从四个层次上对其框架加以展开。首先,公共数据开放可信治理的治理目标,是建立公共数据资源开放的可信赖秩序。其次,公共数据开放可信治理的规范架构,主要包括公共数据的内在信用基础和外在信任框架两个方面的开放规范框架。再次,在公共数据可信治理的具体规范制度层面上,公共数据的可用性与可追溯性构成其内在信用基础;而由法律风险防范、合规机制管理和开放流通规则共同协调的多方主体间信任关系,组成了公共数据流通的外在信任框架。最后,公共数据开放可信治理的实践,除了与公共数据技术层面相配套的标准体系和管理制度外,还可以从关键基础设施、代码规制和算法治理三个方面引入相应可信数据治理工具的辅助应用,从而将公共数据的可信治理落实成为可执行的公共数据治理行动。