高级检索

学术资源

交叉学科研究

当前位置: 首页 -> 学术资源 -> 交叉学科研究 -> 正文

黄锫: 大数据时代个人数据权属的配置规则

信息来源:《法学杂志》2021年第1期 发布日期:2021-06-03

【摘要】个人数据集束是大数据时代的基本生产要素。决定个人数据权属配置规则的竞争准则是:应最有益于维系个人数据集束的生产激励,且应平衡其与降低个体隐私权侵害风险之间的紧张关系,以及平衡其与最大化利用个人数据集束之间的紧张关系。因此,个人数据权属配置的一级规则是:依据“有动机的侵入者”概念所定义的直接识别标准,区分“普通个人数据”与“敏感个人数据”,并将前者配置给数据业者与数据主体共同共有,将后者仅配置给数据主体所有,且只能交易个人数据的使用权。个人数据权属配置的二级规则是:设定普通个人数据集束的独占使用权有效期,期满后普通个人数据的使用权进入公共领域,但是所有权(含删除权)始终归属于原权属主体。

【关键词】个人数据权属;普通个人数据;敏感个人数据;独占使用权有效期


一、个人数据的法律权属之争


个人数据是个人信息通过磁盘介质的固化形式。在传统成文法制度中,个人信息一般被纳入人格权的保护范围,我国学者也曾主张个人信息不能成为所有权的客体,应划入具有意志与精神属性并体现公民人格利益和人格尊严的内在物范畴,不承认个人信息作为法律权属对象的“外在物”的属性。然而在大数据时代这种情形发生了变化,当个人信息被通过技术手段汇入磁盘介质中存储从而形成个人数据后,个人信息就成为了一种特殊的无体物,经历了从作为人格组成部分的“内在物”到作为法律权属对象的“外在物”的转变。虽然学理上对于数据是否属于无体物存在争议,但是由单体个人数据汇集而成的海量个人数据集束在大数据时代事实上已经被作为商品进行交易,甚至许多国家并不禁止个人数据的交易,而交易的前提是个人数据权属的存在。这一客观事实意味着,即使在理念上不承认个人数据作为法律权属的客体,那么也无法否认个人数据作为物的本质特征。而只要我们承认个人数据是一种特殊的物,那么物的权属问题将会必然存在,即使所谓的无主物也是因为承认物的权属存在这一前提才成其为无主物,因此个人数据作为法律权属客体具有必然性。

明确了个人数据可以作为法律权属客体之后,随之而来的争议就是“个人数据权属应当配置给谁?”这一大数据时代的核心问题。在传统的学理上通常认为个人数据的权属应配置给数据主体。例如Jerry Kang认为在互联网空间中包含隐私的个人数据被作为可交易的商品,自然应赋予个体对自身数据的所有权以便限制个人数据的重复利用,Kenneth Laudon认为个人天然拥有自身个人数据的所有权,有权利而没有义务将个人数据出售给其他主体。波斯纳的法律经济学分析同样显示将特定领域中的个人信息(数据)产权配置给个人是有经济学上的理由支撑。国内也有学者持类似的观点。

然而随着大数据时代的到来,计算机网络软硬件技术的快速发展使得大规模收储个人数据成为可能,海量个人数据对企业的发展越来越重要,日益成为企业竞争力的核心资产。于是实践中开始出现代表企业利益的呼声,认为个人数据应归属于实施收储行为的企业(数据业者)所有。如新浪微博在与今日头条发生用户数据抓取的争议后,修改了用户协议,将微博用户发表的内容数据设定为新浪微博独有,虽然在用户的强烈反对下修改了该条文,但新的用户协议中仍然强调未经新浪微博同意,用户不能自行授权第三方获取微博上的个人数据。这体现出新浪微博认为自身应拥有微博上用户数据的权属,显示了和传统学理观点截然不同的另一种认知。这种观点的主要理由是认为将个人数据归于数据业者才能激励个人数据的收储行为,实现大数据时代个人数据中的最大价值。但是如果个人数据归属于实施收储行为的数据业者所有,自然又引发了对个体隐私权侵害风险上升的担忧,如何能够在个人数据归属于数据业者的同时最大限度降低这种风险,就成为个人数据法律权属配置必须应当考虑的问题。

那么,大数据时代个人数据的法律权属究竟应如何配置?为了回答这一问题,我们将适当超越现行成文法的规定,回溯到个人数据的物质特质及其在大数据时代与人类社会发展之间实质关系的原点,探求这一特殊时代背景下确定个人数据权属配置规则的竞争准则,然后依据这一竞争准则的指引选择相应的权属配置方式,以便为成文立法提供判断的选项。


二、个人数据权属配置规则的竞争准则


竞争准则是张五常提出的制度经济学理论概念,意指决定多种制度规则竞争胜负的标准,在此可以借鉴为确定大数据时代应选择何种个人数据权属配置规则的判断标准。结合大数据时代的新时代特征,这一竞争准则应是:

个人数据的权属配置规则应最有益于大数据时代维系个人数据集束的生产激励,同时平衡其与降低个体隐私权侵害风险之间的紧张关系,以及平衡其与最大化利用个人数据集束之间的紧张关系。

对于这一竞争准则可区分为三个层面进行理解:第一,维系大数据时代个人数据集束的生产激励。大数据的核心就是预测,也就是通过对海量数据集束的数学算法运算来预测事情发生的可能性。海量的数据集束对于大数据时代至关重要,是大数据时代的基本生产要素,而个人数据集束就是最为重要的数据集束之一。通过高度发达的数据分析技术可以从个人数据集束中发现人们行为的内在规律,实现对人们未来行为的预测并予以利用,以增进社会总福利。事实上,这也是个人数据在大数据时代的最重要功能。但是个人数据集束并非天然存在,必须要经过收集与存储个人数据两重行为步骤才能形成,这两重行为步骤共同构成了个人数据集束的生产行为。生产行为的前提性存在决定了个人数据集束作为稀缺资源的必然性。正如天下没有白吃的午餐,这种生产行为也并非免费,而是必须要有生产成本的支出,如果这一生产成本无法获得弥补乃至使生产者有所盈利,那么个人数据集束的生产行为就不会发生,作为大数据时代基本生产要素的个人数据集束也就不会存在。因此,大数据时代必须维系个人数据集束的生产激励。

而法律制度是维系这种生产激励的重要途径。法律经济学的研究表明,法律制度可以形成一种激励机制,引导个体从事从社会角度看最优的行动。在由法律制度所构建形成的激励机制中,权利是其中最重要的激励因素。法律制度中对物的权利配置方式会直接影响到社会主体的行为模式,也即物的不同法律权利配置方式对社会主体的行为取向会有不同的引导,产生不同的激励效应。

从表面上而言,如果要维系个人数据集束的生产激励,那么将个人数据的权属配置给数据业者是必要的。这是因为一旦将个人数据的权属配置给数据业者,就意味着数据业者获得了由国家强制力作为后盾,对个人数据集束实施占有、使用、收益与处分的各项行为自由(权能),这些行为自由能够使数据业者合理预期到随之而来的收益将弥补生产个人数据集束的成本支出,并获取高于生产成本的盈利。并且,法律制度上的这种权利保障使数据业者能够合理预测到其他社会主体对这些利益的尊重,或者合理预测到当其他社会主体侵犯自身利益时,自己能够得到潜在国家强制力的保护与补偿,这就为数据业者提供了稳定的获益预期,从而愿意扩大在生产个人数据集束上的投入。不过,如果将个人数据的权属完全配置给数据业者,却会导致其与降低个体隐私权侵害风险及个人数据集束最大化利用的双重紧张关系,这就涉及到对竞争准则另外两个层面的理解。

第二,平衡维系个人数据集束的生产激励与降低个体隐私权侵害风险之间的紧张关系。如果将个人数据的权属配置给数据业者,那么对个体隐私权侵害的风险就可能会大幅上升。这是因为法律权属不但赋予数据业者利用个人数据的形式合法性,而且也使其利用行为获得了心理上的正当性。基于形式上的合法性与心理上的正当性,数据业者对个人数据的利用就会更倾向于实现自身利益而忽略对个体隐私的保护。假使数据业者是以盈利为目的的私权主体(如新浪、腾讯、阿里等商业公司),那么这些私权主体就会加大对涉及个体隐私的数据的开发利用力度,以便实现自身利益的最大化,从而增加了个体隐私受侵害的可能性。而假使数据业者是不以盈利为目的的公权主体(如政府机关等),那么这些公权主体可能会怠于在个体隐私保护上投入成本或履行应尽的谨慎义务,随之也会增加个体隐私数据泄漏的风险。

更危险之处在于,无论是数据业者出于自身利益的考量还是为了避免承担保护个体隐私数据的成本,让其完全拥有个人数据权属都可能会导致涉及个体隐私的数据进入黑市交易。通过交易方式买受个体隐私数据的主体为了弥补购买成本并牟利,也会倾向于对数据加以最大化乃至违法利用,并继续通过交易实施传播,这会大幅度增长个体隐私权受到侵害的风险。其对个体隐私侵害的危害后果一方面表现在诸如手机号码、电子邮箱地址、住宅邮寄地址等隐私数据会被不同的交易主体所利用,使个体的生活安宁被不断打扰。另一方面也表现在诸如非道德活动、违法行为等隐私数据扩散面的增长导致数据主体社会合作面缩小。如个体的不良品行信息被扩散后,使更广范围内的社会主体对其产生情感上的排斥,以及对与其合作中己方利益受损可能性的高估,从而避免与数据主体进行合作。

可见如果将个人数据权属完全配置给数据业者,那么就可能会导致个体隐私权受侵害的风险大幅度增加。然而不配置给数据业者,作为大数据时代基本生产要素的海量个人数据集束又会难以获得充分的生产激励。因此个人数据权属的配置规则必须有益于平衡这种紧张关系。

第三,平衡维系个人数据集束的生产激励与最大化利用个人数据集束之间的紧张关系。个人数据集束是典型的非竞争性物。非竞争性物的典型特质在于不会由于使用而产生耗损,且可以由多个主体同时使用,其效用扩展到他人的成本为零。非竞争性物的这一特质决定了最大化利用方式应是对其趋于无限次的重复使用。这意味着对个人数据集束最大化利用的方式应是让所有主体都拥有使用机会,从而使个人数据集束能够被最大限度的重复利用。

但是,如果将个人数据的法律权属配置给数据业者,这实质上是赋予了数据业者对个人数据的法定垄断,这种垄断将会导致难以实现对个人数据集束的最大化利用。对此可以从数据业者分别为公权主体与私权主体两种情况进行分析:以政府机关为代表的公权主体是大数据时代个人数据集束最重要的收储者之一。公权主体收储个人数据的目的是为了实现本部门的行政职责,因此一旦收储的个人数据集束已经完成自身特定的行政职责——这意味着公权主体已经支付了国家财政支出(工资、福利以及职务晋升)的对价——那么继续开发利用个人数据集束的动力就会大幅度下降。在公职人员不得通过商业经营牟利原则的限制下,继续开发个人数据集束潜在价值所带来的实际收益很难被公权主体(特别是其中的公职人员)自身所享有,于是就不会激励其继续对个人数据进行价值挖掘。并且公权主体内部还存在着不同的组成部门,在政府部门绩效考核及官员晋升制度激励下,横向的政府部门之间会存在着竞争关系。这意味着本部门收储的个人数据集束如果与其他政府部门共享,那么就会导致个人数据集束收益的外溢,使其他政府部门在竞争中增加了获胜的筹码,这就会促使实施个人数据收储行为的政府部门倾向于利用个人数据的法律权属来垄断自身收储的个人数据集束,形成“信息孤岛”,宁愿个人数据集束闲置也不愿与其他部门共享以实现最大化利用。

以商业公司为代表的私权主体是大数据时代另一重要的个人数据集束生产者。私权主体利用个人数据集束的方式可以区分为自体利用和授权利用两种类型,前者是私权主体自己投入成本对个人数据集束进行开发利用,后者是私权主体通过交易的方式授权其他主体开发利用,细究之下可以发现这两种方式都无法实现对个人数据集束的最大化利用。就自体利用而言,单个私权主体的数据技术可能性边界以及可支出生产成本总归有限,这将限制单个私权主体对个人数据集束进行利用的深度、广度与频率。且一旦私权主体拥有了个人数据的法律权属,那么法律权属的垄断特质就会阻碍其他主体对个人数据集束的使用。这意味着虽然从单个私权主体自身而言,是有动力在自身实力范围内对个人数据集束进行最大化利用,但是从社会总体而言却并没有实现个人数据集束的最大化利用。就授权利用而言,私权主体所固有的收益最大化倾向会促使其充分利用法律权属的垄断性来进行营利,即使可以通过交易的方式允许其他主体利用自身拥有的个人数据集束,也必须以其他主体支付相应的对价为前提,而且私权主体甚至会利用这种垄断性迫使其他主体支付更高的对价,这就意味着必然会排除一部分无法或不愿支付相应对价的主体的使用行为。因此从社会总体福利而言,个人数据集束依然无法被最大化利用。

由此可见,将个人数据的权属配置给数据业者虽然可以维系个人数据集束的生产激励,但是却与降低个体隐私权侵害风险、最大化利用个人数据集束两者之间形成了双重紧张关系。大数据时代个人数据权属的配置规则必须在有益于维系个人数据集束的生产激励的同时,又能平衡这样的双重紧张关系,而这也正是衡量大数据时代个人数据权属配置规则的竞争准则。


三、个人数据权属配置的一级规则:平衡数据生产激励与个体隐私权保护


为了平衡维系个人数据集束的生产激励与降低个体隐私权侵害风险之间的紧张关系,大数据时代个人数据权属配置的一级规则应是:

依据“有动机的侵入者”概念所定义的直接识别标准,将个人数据区分为“敏感个人数据”与“普通个人数据”两种类型,并将普通个人数据的权属配置给数据业者与数据主体共同共有,敏感个人数据的权属仅配置给数据主体。同时,对于个人数据的交易行为而言,只能就个人数据的使用权进行交易,其所有权始终归属于原权属主体,不能通过交易行为转移。一旦出现损害个体隐私权的可能性时,原权属主体都有权随时行使删除权。

(一)一级规则的基石:敏感个人数据与普通个人数据的界分

个人数据中“敏感个人数据”与“普通个人数据”的区分是权属配置一级规则的基石。敏感个人数据意指能够直接识别特定个体身份的个人数据,如姓名、身份证号、家庭住址、手机号码、银行账号、微信号、支付宝帐号等,普通个人数据则是指难以直接识别特定个体身份的个人数据,如电商网站上购买商品的种类、购买者的性别与年龄、行人活动的大体范围(共享单车的行驶轨迹)等。这种区分与欧盟《一般数据保护条例》(GDPR)中对个人数据的定义思路不同,后者定义的个人数据是指与一个已经被识别或者可以被识别的自然人(an identified or identifiable natural person)有关的信息,除此之外的信息不受《个人数据保护指令》的规制。而本文所提出的敏感个人数据相当于欧盟个人数据保护法中的“已经被识别的自然人的信息”,但是不包括“可以被识别的自然人的信息”。因为在大数据时代,随着数据分析技术的发展,所有个人数据都有可能在技术上成为识别个体真实身份的信息,区别仅在于识别的难易程度以及不同主体拥有技术力量的区别。也就是说在大数据时代并不存在所谓“无法识别个人身份的个人数据”,任何个人数据在极端的数据技术条件下都可以识别出数据主体的真实身份,从而实现非匿名化。换言之,普通个人数据在大数据技术条件下总是存在着转化成敏感个人数据的可能性,并不存在绝对不能识别个体真实身份的个人数据。在这一意义上,个人数据的“去身份”事实上不可能完全实现。所以,我们只需区分已经直接识别出个体身份的个人数据与尚未直接识别出(但是有可能识别)个体身份的个人数据即可,这也对应了敏感个人数据与普通个人数据的概念区分。

敏感个人数据与普通个人数据区分的关键在于通过个人数据是否能够“直接识别”特定数据主体的真实身份。我们可以将“直接识别”的标准立基于技术领域中“有动机的侵入者”(a motivated intruder)这一概念之上,也即当受检测的个人数据可以被一名“有动机的侵入者”用以识别特定个体时,该个人数据就可以被定义为属于敏感个人数据。“有动机的侵入者”是由英国信息专员办公室(Information Commissioner's Office, ICO)发布的《匿名化:数据保护风险管理操作准则》(Anonymisation: managing  data protection risk - code of practice)中提出的概念,该操作准则提出了“有动机的侵入者测试”(the motivated intruder test)来衡量数据业者所掌握的数据是否能够对个体身份进行再识别(re-identification)。“有动机的侵入者”被定义为具备普通人的合理能力,在目的明确的情况下可以通过常人能够使用的技术手段(如网络、图书馆、各类公共档案等)将个人数据与特定个体建立可靠联系,从而直接识别特定的个体身份。但是“有动机的侵入者”不能被认定为诸如黑客此类具有专业性知识的数据分析专家,也不能是拥有特殊分析工具的主体,同样也不能是诸如入室抢劫罪犯此类通过违法行为获取信息的主体等。也即“有动机的侵入者”所具备的数据分析能力应介于普通民众与技术专家之间。

虽然这一直接识别标准无法将敏感个人数据与普通个人数据进行一刀切的截然划分(事实上两种个人数据之间的区别毋宁说是一段连续的光谱,区分界线随着具体场景的变化会发生位移),但是这一标准可以作为数据业者评估个人数据侵权风险的判断依据,也可以作为执法主体或司法主体在法律判断时采用的原则性标准。也即可将其作为数据业者与第三方法律实施主体共享的判断个人数据类型的识别性依据。这一富有弹性的直接识别标准能够适应大数据时代动态变化着的敏感个人数据与普通个人数据的界线,在不同情境中确定个人数据保护的边界,与学者所提出的“基于场景的风险管理理念重构个人信息保护的新路径”有异曲同工之妙,也符合学者提出的个人数据的“场景化规制”。

(二)通过权属配置平衡数据生产激励与个体隐私权保护

在区分普通个人数据与敏感个人数据的基础上,个人数据权属配置的一级规则有利于平衡维系个人数据生产激励与个体隐私权保护间紧张关系,理由在于:

第一,对个体隐私权产生严重侵害的必要前提是对数据主体真实身份的精确识别。虽然数据主体身份的模糊识别也可能会对个体隐私产生一定的影响(如个体的手机号码信息泄露后被动接受商业广告信息),但是真正会对个体隐私权产生严重侵害的还是真实身份的精确识别。典型如个体的反道德行为(出轨、家庭暴力等)只有在数据主体的真实身份被人精确识别后,才有可能产生侵害其隐私权的真实损害后果。更易理解的例子是,在艳照门类型的个体隐私权侵害事例中,只有艳照门主角的确切身份被人精确识别,才有可能产生对个体隐私权的侵害后果,否则艳照仅仅只是一组淫秽图片而已。

敏感个人数据是能够直接识别数据主体真实身份的信息,它属于个体最核心的隐私信息。普通个人数据虽然也可能会包含个体的隐私信息,但是如果没有敏感个人数据将隐私信息与数据主体的确切身份予以勾连,那么就不会产生对个体隐私权的严重侵害后果。敏感个人数据的隐遁就如同电视新闻报道中加于受访对象面部的马赛克,能够在公开受访对象观点的同时防止其身份的泄露,保护其个体隐私。因此从理论上而言,只要敏感个人数据受到切实的保护,就能大幅度降低个体隐私权侵害的风险。由此,如果将敏感个人数据的权属配置给数据主体,意味着数据主体对此类数据拥有绝对控制权。数据业者对敏感个人数据的收储与利用行为将受到数据主体的全方位权利制约,这些权利制约的主要内容包括:收集此类数据必须事先明确告知数据主体并获得明示同意、利用此类数据的方式也必须限定在数据主体明确同意的范围内等。特别是未经数据主体的明示同意,数据业者无权将敏感个人数据进行交易,也即知情同意规则仍然应当严格适用于此类个人数据。并且,即使经过数据主体的明示同意,数据业者也只能将敏感个人数据的“使用权”进行交易,数据主体始终拥有敏感个人数据的所有权。这种权属的设置方式意味着数据主体有权对敏感个人数据随时行使删除的自由,即实施所谓的删除权。也就是说,即使数据业者利用此类个人数据的行为并未对数据主体造成实际的损害,数据主体也有权向其主张删除关涉自身的敏感个人数据。

这些来自于数据主体的权利制约会使数据业者利用敏感个人数据的成本显著提高。正如行为经济学研究指出,人们选择任一可选行为方案的欲望,与这一可选行为方案的代价成反比。基于这一行为规律,数据业者选择利用敏感个人数据侵犯个体隐私权的概率就会降低(当然并不会完全消除),也就意味着个体隐私权侵害风险将会降低。简言之,这种对敏感个人数据的权属配置方式虽然不能“消除”个体隐私权受到侵害的可能性,但却可以“降低”敏感个人数据被滥用的可能性,进而降低个体隐私权受侵害的风险。

第二,一旦数据业者与数据主体共同拥有普通个人数据的法律权属,对数据业者而言就意味着拥有了法律上所承认的、对普通个人数据进行收储与利用的行为自由。这些行为自由主要是指:数据业者收集此类个人数据的收储行为只需告知数据主体,且只需获得数据主体的默示同意。也即只要在数据主体没有明确拒绝的情形下,数据业者就有权收储普通个人数据以便生产个人数据集束。并且,当产出了个人数据集束后,基于数据业者的共同共有权,数据业者使用此类个人数据集束的行为也无需获得数据主体的同意,有权不断深入开发普通个人数据集束中的潜在价值,且无需担心法律授权的缺失问题,从而避免了反公地悲剧所导致的高昂交易成本的困扰。

当然,由于普通个人数据的权属由数据业者与数据主体共同共有,因此数据业者虽然有权使用普通个人数据集束,但是在不经数据主体明确同意的前提下,无权将普通个人数据集束作为交易的对象(也即不经共同共有人的同意则无处分权)。且即使征得数据主体的同意,数据业者也只能够交易普通个人数据的“使用权”,其所有权仍始终与数据主体共同共有。这种将个人数据的所有权与使用权相分离的权属配置方式,其主要功能在于当普通个人数据的受让方侵害了数据主体的隐私利益时(如受让方依据自身高于普通水平的数据技术能力识别了数据主体的身份并加以利用),数据业者和数据主体都有权行使删除权,从而降低个体隐私权受到侵害的风险。

第三,数据业者所享有的共同共有权也使其能合理预期自身为生产个人数据集束所支付的成本将得到补偿并进而获利,不用担心数据主体基于法律权属任意收回普通个人数据,从而能够充分为收储与利用普通个人数据集束进行成本投入,无需“留一手”,维系个人数据集束的生产激励。虽然这种共同共有权维系的主要是普通个人数据集束的生产激励,并不能维系敏感个人数据集束的生产激励,但这对大数据时代的发展并不会产生太大的影响。这是因为大数据分析预测功能实现的关键在于作为分析对象的个人数据集束的“海量性”,单体个人数据的殊异特质对于大数据分析而言并非关键,甚至单体个人数据存在错误之处也不会影响大数据分析的结果,即大数据分析允许“不精确”,只要能够在“海量”的个人数据基础上进行技术分析,那么对未来的预测功能就不会被削弱。这意味着在个人数据集束中,即使缺失了可以直接识别特定个体身份的敏感个人数据,只要能够确保普通个人数据的体量,就不会对大数据分析结果的精确性产生实质性影响。

更何况,将敏感个人数据的权属完全配置给数据主体,并不意味着敏感个人数据一定无法被纳入到大数据分析中,只不过要求数据业者在收储与利用敏感个人数据时应受到知情同意规则与数据主体删除权的严格约束。也即数据业者仍然可以通过传统上的知情同意规则来实施敏感个人数据的收储与利用行为,只是此时要求数据业者必须获得数据主体的特别授权(且必须是明示同意而不能默示同意),并且明确敏感个人数据的具体利用方式(且必须用逐项列举的方式告知数据主体而不能采取概括告知的方式)。同时数据主体始终拥有敏感个人数据的删除权,有权随时要求数据业者删除关涉自身的敏感个人数据,从而降低个体隐私权受到侵害的风险。


四、个人数据权属配置的二级规则:平衡数据生产激励与数据最大化利用


为了平衡维系个人数据集束的生产激励与最大化利用个人数据集束之间的紧张关系,大数据时代个人数据权属配置的二级规则应是:

限定数据业者和数据主体对普通个人数据的独占使用权有效期(公权主体作为数据业者时除外),数据主体对敏感个人数据的权属则不设使用权有效期。在独占使用权有效期届满后,普通个人数据的使用权应进入公共领域,允许其他社会主体使用,以实现对普通个人数据集束的最大化利用。但是普通个人数据的所有权(含删除权)则始终归属于数据业者和数据主体共同共有,一旦出现损害数据主体隐私权的可能性,共同共有人都有权随时行使删除权。

正如上文曾述,个人数据这一特殊物所具有的经济学特质是“非竞争性”。物的“非竞争性”特质意味着一个主体对该物的使用不会减损另一个主体的使用可能,主体间对该物的使用不会相互排斥。在非竞争性特质的作用下,对非竞争性物重复使用的次数越多、频率越高、范围越广,那么对使用主体产生的需求满足度就会因累积效应而越高,也就意味着越充分地利用。因此,对于普通个人数据而言,使用的主体越多,运用的频次越频繁,那么产生的社会福利总量也就越高。并且,各类社会主体对普通个人数据的利用并不需要拥有所有权,只需要掌握使用权即可达到最大化利用的目的。因此,设置普通个人数据权属主体的独占使用权有效期,在期满后放开其使用权的限制,就能够让公共领域中的主体都有利用普通个人数据的机会,最大化其使用价值。

同时,为了避免随着数据分析技术的提高导致普通个人数据向敏感个人数据转化而对个体隐私权产生侵害的潜在可能性,在法律制度的权属设计上仍应坚持数据业者和数据主体对普通个人数据的共同共有,以便在产生个体隐私权侵害可能性时把住关键的闸口,随时行使删除权,最大限度降低对个体隐私权的侵害风险。当然,由于敏感个人数据与个体隐私权休戚相关,因而不能对其设置使用权的有效期,而应始终将其权属归于数据主体。进一步而言,在这种个人数据权属的二级规则中,依据数据业者是私权主体抑或公权主体的不同,还存在不同的规则设置形式。

(一)数据业者为私权主体时二级规则的设置

当商业公司此类私权主体作为数据业者与数据主体共有普通个人数据的法律权属时,可以在成文立法中将独占使用权有效期间设定为固定年数(比如10年)。在此独占使用权有效期间内,作为数据业者的私权主体享有收储、开发利用普通个人数据集束的收益,这些收益用来弥补私权主体支出的收储成本和开发利用成本,激励私权主体持续实施个人数据集束的收储行为和开发利用行为。私权主体独占使用权有效期内对普通个人数据集束的收益权利可以视为法律制度激励功能的兑现,避免法律制度中的获益承诺成为空头支票从而丧失对数据业者的持续激励。同时,数据主体在独占使用权有效期内仅对关涉自身的个人数据享有收益的权利,这些收益的具体范围体现在其与私权主体达成的个人数据收储协议中,通常以私权主体对数据主体提供特定的服务作为收益的表现形式。而私权主体通过收储、开发利用个人数据集束产生的收益则不包括在数据主体的收益范围内。如淘宝网收集买家购物的个人数据时,买家的收益是淘宝网提供的免费电商服务,但并不享有淘宝网开发利用买家购物数据集束产生的收益,这些收益仍应归淘宝网所有,以便激励其继续实施个人数据集束的收储、开发利用行为。

在独占使用权有效期届满后,普通个人数据集束的使用权应进入公共领域,其他社会主体有权使用,享有相应的收益权利,以实现普通个人数据的最大化利用,平衡其与维系个人数据集束的生产激励之间的紧张关系。虽然独占使用权有效期的设定会导致一部分普通个人数据无法及时进入公共领域,出现个人数据内容滞后的问题,但这是为维系个人数据集束的生产激励所必须支付的社会成本。并且由于相对滞后的个人数据集束一旦进入公共领域,隐藏在数据集束深处的应用价值会被不断挖掘出来,因此也可以弥补因个人数据内容滞后所产生的社会福利损失。当然,对于此类使用权进入公共领域的个人数据,私权主体与数据主体仍应保留所有权(含删除权),当这些进入公共领域的普通个人数据在特定技术条件下转变为敏感个人数据,进而对个体隐私权产生侵害时,无论是私权主体还是数据主体都有权行使删除权。虽然这种将普通个人数据的所有权与使用权分离的思路并不能杜绝个体隐私权侵害风险的存在,但是删除权的存在至少为数据主体的隐私权的救济提供了法律工具,降低了个体隐私权受到侵害的风险。

此外,对于法律权属主体独占使用权有效期的长短并没有确定的标准,这更多取决于立法过程中的利益博弈。只是其中有一个问题需要澄清,即法律权属主体的独占使用权有效期的起算点是应从数据业者对个人数据收储形成个人数据集束之日起算,还是应从个人数据产生之日起算?从实际具有可操作性的角度而言,选择后者更为可行。因为数据业者对个人数据的收储行为是一个连续动态发生的过程,如淘宝网对买家购物行为信息的收集是不间断的过程,个人数据集束也是持续扩容的变动过程,这与普通物品从产出之日起其物理边界就大致保持不变的特性不同。因此,法律权属主体独占使用权有效期的起算点从个人数据形成之日起计算具有现实可行性。也即在成文法中可以规定数据业者应定期将超出独占使用权有效期的个人数据集束公开,进入公共领域,实现普通个人数据集束的最大化利用。当然,在数据业者公开到期的个人数据集束之前,应设定其应承担数据评估的义务,确保在公开时这些个人数据没有转化为敏感个人数据。

(二)数据业者为公权主体时二级规则的设置

如果是诸如政府机关此类公权主体作为数据业者与数据主体共享普通个人数据的所有权时,情况就比较特殊。这是因为公权主体不需要像私权主体那样通过兑现法律制度中的获益承诺来维系个人数据集束的生产激励,公权主体所收储的个人数据集束通常只是在履行法定行政职责时的副产品。换言之,对于公权主体作为数据业者,不需要维系其个人数据集束的生产激励,因此也就无需设定此类普通个人数据集束的独占使用权有效期。于是,公权主体作为数据业者时的最大问题仅在于可能会阻碍对个人数据集束的最大化利用。正如前文所述,公权主体一方面因不得通过个人数据集束获益的制度限制而缺乏开发个人数据集束潜在价值的动力,另一方面也因内部不同政府组成部门的竞争关系而形成分割的信息孤岛,各个部门分别把守着自身收储的个人数据集束,宁愿这些个人数据集束闲置,也不愿与其他部门收储的个人数据进行交流汇集,以实现个人数据集束本可以产生的价值。因此,在这一类普通个人数据权属配置的二级规则中,应设定公权主体与数据主体共同共有此类普通个人数据,并且不存在独占使用权有效期,此类普通个人数据集束的使用权自形成之始就应在公共领域中,社会各类主体都可以使用,以便最大化其使用价值。

如果这一分析能够成立,那么我们或许就为目前方兴未艾的政府数据开放运动提供了理论基础。政府数据开放是指通过互联网数据集成平台向社会共同提供无需特别授权、可被机器读取、能够再次开发利用的原始公共数据。这一运动起源于美国,奥巴马政府在2009年发布了开放政府指令(Open Government Directive),并推出世界上首个政府数据开放平台(www.data.gov)。2010年,英国的政府数据开放平台(www.data.gov.uk)也正式上线。我国国务院在2015年也发布《促进大数据发展行动纲要》,其中提出要建成国家政府数据统一开放平台。在政府数据开放运动主张公开的公共数据中,就包含了政府部门收储的普通个人数据集束。前文的分析为大数据时代的政府数据开放运动提供了这样一种理论基础——正因为作为公权主体的政府部门在收储形成普通个人数据集束之后并不拥有独占使用权的有效期,所以才有义务将其收储的普通个人数据予以公开,允许社会主体使用这些普通个人数据,以避免因法律权属垄断性所导致的个人数据难以最大化利用的弊端,充分发挥数据这种特殊的非竞争性物对于增进社会整体福利的功能,推动大数据时代的持续发展。当然,在开放普通个人数据集束使用权的同时,公权主体仍然与数据主体共同拥有其所有权(含删除权),当数据分析技术的进步使这些普通个人数据可以“直接识别”数据主体的身份,转变成敏感个人数据并对数据主体的隐私权可能产生侵害时,公权主体与数据主体基于其共同共有的权利,都应拥有对这些数据的删除权,以便最大限度实现对数据主体隐私权的保护。


五、结语


综上所述,大数据时代个人数据权属的应然配置应满足维系个人数据集束生产激励的需要,并应在依据“有动机的侵入者”概念所定义的直接识别标准区分普通个人数据和敏感个人数据的基础上,通过将普通个人数据的权属配置给数据业者和数据主体共同共有、将敏感个人数据的权属配置给数据主体所有、将个人数据的交易对象限定在数据使用权上等权属配置规则来平衡维系数据生产激励与降低个体隐私权侵害风险之间的紧张关系。同时应通过设置普通个人数据的独占使用权有效期的方式引导其进入公共领域,以平衡维系个人数据生产激励与最大化利用个人数据之间的紧张关系,推动大数据时代的纵深发展。