高级检索

学术资源

行政法学

当前位置: 首页 -> 学术资源 -> 行政法学前沿 -> 行政法学 -> 正文

於兴中、郑戈、丁晓东:生成式人工智能与法律的六大议题:以ChatGPT为例

信息来源:《中国法律评论》2023年第2期 发布日期:2023-07-28

 要:ChatGPT是一种自然语言处理机器学习模型,是一种人工智能。它使用第三代生成式预训练变换模型(GPT-3)来生成类似人类撰写的文本,从简单的聊天对话到编写软件代码、生成文案和论文。ChatGPT采用基于人类反馈的强化学习(RLHF)优化了在与真人对话时充分考虑上下文和语境的能力,在很多时候可以以假乱真,让使用者觉得是在跟真人对话。由于其性能远超过去的所有聊天软件和语音助手,所以自2022年11月公测之后,引发了全球的广泛关注,已经成为一种现象级的应用。目前,各大网络平台尤其是搜索引擎,都将ChatGPT或类似的大型语言模型(LLM)作为全力研发的重点,比如谷歌(Google)和必应(Bing)已经着手将大型语言模型内嵌于搜索引擎之中,使搜索变得更加智能化、互动化和语境化,这必将给互联网生态带来新一轮革命性的冲击。鉴于此,《中国法律评论》特邀澳门大学法学院於兴中教授、上海交通大学凯原法学院郑戈教授和中国人民大学法学院丁晓东教授,从法律角度深入讨论如何应对ChatGPT带来的挑战,包括其对法律职业的冲击,对法律思维的替代,在法律场景的应用,对知识产权和创新的保护,对平等问题和文化多样性问题的影响,以及对算法歧视的应对,等等。希望法律界、科技界和产业界共同努力,构建一个打破界别、突破知识领域的共同体,引导人工智能向有利于人类福祉的方向发展。


郑戈:今天非常高兴和於兴中老师、丁晓东老师一起讨论ChatGPT与法律的问题。

作为一种大型语言模型,ChatGPT有三个主要特点,都涉及一系列潜在的法律问题。首先,大型语言模型都是代码层的基石性模型(foundational model),可以被应用到一系列下游场景中,从搜索引擎、内容平台到应用软件。基石模型的开发者因此成为数字技术市场的“看门人”,拥有强大的市场支配力量。同时,基石模型也可以应用于各种公共服务场景,包括智慧法院、智慧检务和智慧公安。这种应用需要法律和公共政策的引领。

其次,ChatGPT这样的大型语言模型具有生成性,属于人工智能生成内容(AIGC)这一产业的重要组成部分。与从大量数据中寻找隐藏模式并形成预测的分析式人工智能不同,生成式人工智能可以通过学习海量的人类创造的内容来生成新的内容,这对规范创造性人类活动的法律(比如知识产权法)提出了新的问题。

最后,大型语言模型具有通用性,可以服务于不同政治目的和商业模式所确定的任务,并通过基于人类反馈的强化学习寻找完成这些任务的最优解。目前我们已经看到ChatGPT被用来代写作业、制作假新闻以及传播基于特定偏见的真假莫辨的“意见”而不是知识。而未来的大规模应用还可能暴露出更多的具有深远文化影响的问题。这种塑造整个数字文化生态的能力值得引起法律界人士的警觉,思考其中可能出现的新的“稳态应变”(allostasis)机制和新的风险。基于几位对话者的学术专长,我们主要从法理层面讨论其中涉及的基础性问题。

我把我们今天要讨论的几个问题也提给了ChatGPT,在讨论每一个问题前,我们也先看看ChatGPT的回答。这样我们的讨论就似乎是在三个人和一个机器之间进行。


第一个问题


郑戈:第一个问题,我们都知道法律的力量就来自于语言的力量,语言对于法律来说是基础性的、是核心性的。作为大型语言模型的ChatGPT基于对大量法律文本(从法学著作到判决书,从合同到公司章程)的学习,完全有可能在对话和论辩场景中熟练使用法律语言,这对法律职业将对产生何种冲击?





我把第一个问题向ChatGPT提问,它的回答是:ChatGPT和其他大型语言模型可以极大地提高法律行业的办公效率和生产率,使得律师等人员更加能够把握重点和把精力放在更有意义的事情上面。

我又进一步问它:如果ChatGPT可以通过一个法律的职业资格考试,这是否意味着它可以从事法律职业?因为美国有一些教授已经做过这样一个测试,发现它可以通过某个州的律师资格考试。ChatGPT自己的回答是“不”,它说:“我仅仅是一个机器学习模型,不能代表人类获得法律职业资格。”它说:“自己可以帮助人们理解法律,但是不能参与实际的法律行动,比如发布法律命令、撰写合同和代理案件,等等。”

我又接着问它,为什么?能否从事一种法律职业主要考虑的不就是是否具备法律专业能力吗?如果ChatGPT被证明具备从事法律职业的专业能力,为什么不能从事法律职业呢?它又回答说“我们不能仅仅从专业能力出发,法律职业是一个关乎人的职业,涉及人与人之间关系的处理等”。

这些答案还是蛮标准的,很多人都会同意,所以我就想从它的回答角度引入我们的讨论,先请於老师来分享高见。


於兴中:各位好,今天非常高兴能够在网上见到你们。ChatGPT推出来以后,人们非常兴奋,这种兴奋程度可能在互联网历史上是非常少见的。但是这种兴奋时间持续比较短,大概就4个月的时间,现在热情已经慢慢在降温;而且有好多人开始担心,甚至是恐惧。这就是刚才郑戈说的,学生有可能用它来做作业、作弊,甚至是通过各种各样的考试。据说美国至少有四所法学院学生们用这个工具通过了考试,但是考试的分数并不高,是C+,C+应该说就是比较差了。刚才郑戈说他问ChatGPT,它自己的回答是说不会代替人、不会代替律师,这还是有点自知之明的。

ChatGPT到底能够达到什么样的水平,能够做出什么事来,对此人们的看法还是不太一样的。像比尔·盖茨(Bill Gates)接受《德国商报》专访时说,ChatGPT这种具备拟人化能力的智能产品将改变世界,是相当于个人计算机(PC)或者是互联网诞生一样的变革性技术。可见,他对它的希望非常之高,相当于个人计算机、互联网诞生一样,这就是太高的期望了。比尔·盖茨还说,到目前为止,多数人工智能的智能产品只能读写但不具备理解人类意图的能力,而ChatGPT突破了这一技术瓶颈。

我看到一个报道上有人问ChatGPT项目的负责人米拉·穆拉蒂(Mira Murati),也是OpenAI的技术总监说,现在真正突破性的技术一定会解决一个问题,ChatGPT到底解决了什么问题?她回答说,ChatGPT本质上是一个大型的对话模型,一个被训练的大型神经网络,它可能会编造事实。而且她说,我们把自己的“孩子”投放到世界上的时候,没有预计到会引起这么大的兴趣。但事实上,她还想知道ChatGPT到底有什么样的作用,有什么样的好处。

我始终觉得,对于新技术的出现,我们应该采取一种科技现实主义的态度,也就是首先弄清楚我们面对的是什么,它到底是一种什么样的东西。这个前面也谈到,ChatGPT首先是一种大型的对话语言模型,并不能够触及语言之外的活动。人类的活动是各种各样的,语言活动只是其中之一;尽管语言是非常重要的存在方式,但是ChatGPT只是与语言有关,语言之外它就不起任何作用了,这是很清楚的一个局限性。而且现在推出来的ChatGPT是一个测试版,远未成熟,它的训练还不够,不会实时查询,也无法提供新的知识,再加上算力不够,它对上下文的理解也不是很清楚。

当然有些人可能就会问到,既然是一个测试版,那把它发布出来是不是一件道德的事情?有的人可能觉得这是不道德的事情,实际上你是拿别人在训练,那么你误导了人怎么办呢?因为有些人是真的相信它,有可能从里面得到一些知识或者一些有用的东西。这样一个测试版虽然有很大的训练基础,但是它的训练还是不够,因为训练一次要花很多很多钱,它的运作成本是非常大的;再加上它实际上是知识重组,而不是创造新的知识,不像我们以前说的知识再生产或者是知识生产,它的局限性就非常大了;而且它传播错误知识和信息的可能性极大,所以在这种情况下我们首先应该采取一种科技现实主义的态度,先认识到它的局限性,然后要重视,但是不能够依赖。

就法律职业来讲,我觉得ChatGPT会对其有影响,但不是根本性的影响,因为法律职业需要判断。但是我们要发展地看,如果发展到有一天ChatGPT能够自己判断了,这个就很难说了。实际上从某种意义上来说,ChatGPT可能也不知道自己在说什么,它只是通过重组、通过训练知道的,如果有一天它的能力提高了,达到了所谓的从量变到质变的状态,有可能它的大规模训练就可以变成创新,由训练转入创新,这个时候就不得了。

而且就现在的发展情况来看,OpenAI正在设计ChatGPT Plus,可能会更加专业一些,也就是说现在所搜集到信息并不是很专业的,ChatGPT Plus有可能会针对各个不同的专业,比如法律、保险、医疗、金融,有目的地建构一个平台,这是有可能的。但是目前无论如何,我觉得它也只能做律师的助手,只能辅助,不能做判断。

我们还应该考虑到法律职业本身,其实法律职业有很深的地方保护主义性质。比如,我国香港和澳门地区的法律职业,你想要进的话进不去,美国各个州的地方保护主义是非常严重的,而且有些保护主义的措施虽然不是理智的措施,但是它是行之有效的,即便是人也很难进得了,更不要说一个机器。同时话说回来,律师也需要紧跟形势,学习掌握ChatGPT,并且有意识地筛选、审核,为己所用。这个是不需要禁止的,因为它不是一件很简单的事情,很可能禁不掉的。


郑戈:谢谢於老师。於老师刚才也提到,其实ChatGPT提供的信息里面是有真有假的,而且它自己似乎没有能力来进行区分。就我测试的结果来说,而是它回答某些主观题时表现非常好,但是回答客观题时它的得分会比较低,这也是很多人测试的真实结论。

比如像我问它一个特定的国际书号,对应的是哪本书,它就说是某一本书,但完全对不上。然后我就批评它说如果对于事实问题没有查证,就说不知道,胡诌是不对的,它也表示认错。接着我又问它《民法典》第1307条的内容是什么,我们知道《民法典》一共就1260条,1307条根本不存在。这可以说是一个非常简单的客观题了,任何搜索引擎都可以给我们正确的答案,但是它又胡诌了一通,然后我告诉它回答错误,它又在那儿认错。

这就是说我们现在还不能用ChatGPT来获得靠谱的知识,更不用说完全信任它来代写靠谱的文本了。有人说它是“什么都懂一点儿,什么都不精通”(Jack of all trades, master of none)。而且,ChatGPT显然不具备实时搜索功能,它受既有“知识储备”的限制,也就是说,它对2021年之后出现的新知一无所知。我看到一位著名的知识产权法学者将ChatGPT定位为“智能搜索引擎+智能文本分析器+智能洗稿器”,这是一种严重的误解。OpenAI刚刚发布的GPT-4多模态自回归模型或许会整合实时搜索功能。






下面我们再听听丁晓东老师的高见。


丁晓东:谢谢郑老师,谢谢前面於老师精彩的开场。我对ChatGPT的感受和前面两位老师很相似,有一个说法是,它最大的一个特征就是一本正经地胡说八道。这个说法可能有点过分了,ChatGPT在准确性方面的提升是有目共睹的。但它的准确性提升主要不是数学或科学意义上的提升,而是交互意义上的提升。相比其“理科”能力,其提升的最主要是“文科”能力。而且,它在英文里面的准确率又比中文要高。

对我来说,我比较关注的是两个方面的问题:一个方面的问题,就是ChatGPT产生前后的法律环境。这包括它为什么能够产生,例如我们的数据法律与政策是否符合人工智能时代的特征,什么样的数据法律和政策才能满足ChatGPT的训练?因为我们知道,它的数据训练量达到了45TB这样一个惊人的程度,这其实在很大程度上是依赖于英文世界网络的公有领域的政策。在我国,如何对待网络,包括互联互通、公有领域、数据公有的问题,我觉得是值得反思的。

目前,人文社科特别是法学界对于数据的汇聚问题或规模问题的关注还非常不够。但数据汇聚与规模问题实际上是大数据与人工智能能够发挥问题的关键,我国的相关法律如果不注重公有领域制度的建构,如果不探索与互联网与人工智能相配套的法律制度,将对ChatGPT以及未来的人工智能发展造成很大阻碍。当然还涉及算法相关的一些问题,例如ChatGPT出现问题后的算法透明、算法解释权等问题。如何构建一种可信任的算法解释机制,是人工智能法律问题中的一个经典问题。

另外一个问题也是刚刚於老师和郑老师谈到的,它对于法律职业的冲击问题。这里说的法律职业,既包括法官,也包括律师,特别是我们法律教师和法律专业的同学们,我想它所带来的冲击和挑战也是非常现实的。虽然ChatGPT的准确率或者客观性没有特别大的一个提升,但是它对于我们语言的组织、对于法律素材的收集和整合能力,会带来很大的冲击,替代法律职业共同体的很多初级工作。

其实在用ChatGPT的时候,我经常想到一个非常有名的形象,就是德沃金在《法律帝国》里面提到的一个赫拉克勒斯。按照德沃金的说法,法律的最佳判断不仅仅是一些法条,而是对法律体系的整体性或融贯性理解。在德沃金那里,最理想的法律人要成为像赫拉克勒斯这样的法律“大力士”,对法律的判断应当对进行穷尽性的理解。ChatGPT和其他基于大数据训练的人工智能就像这样一个角色,可以增强法律人更深入“法律帝国”的能力。

我也非常赞同於老师的科技现实主义的观点,我想提另外一个启发,就是除了对于科技有一个现实的认识,我们对于个人、对于法官也要有一个现实的认识。我们人也是不完美的,人在收集很多的资料、收集法条时经常也会有遗漏,经常也会有很多的错误。因此我们在分析ChatGPT及其法律应对的时候,不能以完美的视角和要求对其进行规制。

此外,ChatGPT已经在论文写作等领域被广泛应用,学校可以禁止考试时应用,但禁止其一般性运用并不现实。从法律与决策的角度看,未来的问题可能是如何理解人机交互问题。人工智能已经成为了一种辅助决策或“军师”。传统法律对于“军师”“智囊”的分析就存在争论,例如军师和智囊的权重应当如何配置,其是否应当对决策建议承担责任?人工智能辅助决策也将面临这样类似的问题,不过由于涉及到人机交互,其问题将更为复杂。


郑戈:谢谢丁晓东老师。实际上我的很大一部分观点和刚才於老师讲的以及丁晓东老师讲的都是吻合的,我非常同意他们两位的观点。我就简单补充两点:

第一,我认为ChatGPT和GPT-3等这种大型的语言模型一样,它被称为“foundational model”(基础性或者是基石性的模型),它旨在为其他下游的应用提供一个基础,因为它学习的语言数据一方面量非常大,另一方面也缺乏专业特定性。比如说GPT-3的参数数量就已经达到了1750亿个,也它是一个巨大的通用语言模型,下一步发展很可能就是更加专业化的。比如说在这个模型基础上学习更多法律专业领域的文本,它在法律专业领域的能力可能就会得到很大的提升。我们不能根据它现有的解决法律专业领域问题的能力来判断它的真实能力,因为现在还没有专门使用法律文本来对它进行训练。

训练除了训练数据和输入数据以外,还有一个非常重要的维度,就是所谓的测试基准(benchmark); 如果没有测试基准我们就无法判断机器学习所取得的进步。现在最成熟的基准可以说是计算机视觉领域的图像测试基准数据集(ImageNet),它有上千张图片作为测试基准,这样才能够判断某一个具体的模型是否是真正意义上的进步。但是在这个方面,法律领域存在数据上的障碍,因为大量的法律文本出于各种原因是不公开的,要么是因为国家利益方面的因素,要么是出于律所和企业的商业方面的考量。你没法取得如此巨大的数据量来训练法律专业领域的模型,更无法搭建适当的基准。这可能是一个非常大的问题。

第二,就是於老师提到的整个法律职业是制度环境下的一种特定的职业,它受到法律的保护主义等各方面因素的影响。就是说什么样的人有动力,也有资源来训练这样的模型呢?我们现在还想不到,因为这种通用的大型语言模型是有非常明显的商业方面的利益驱动,比如它可以用在搜索引擎,用在各种各样的场合;但是对于法律专业领域的大型语言模型,我们看不到有谁去驱动它,除非是国家。这两个方面的因素,就导致ChatGPT之类的大型语言模型可能为法律人提供了一种新的工具,但是它对法律职业本身的冲击力可能并不像很多人想象的那么巨大。


第二个问题


郑戈:第二个问题是,法律语言以及这种语言所承载的法律思维中有哪些人类独有的,无法用积习学习所生成的语言来替代的部分?这是从法律思维本身的独特性出发来考虑,来反思一下像ChatGPT这样的大型语言模型它可以回答一些主观题,它很能够自圆其说,甚至会模仿人类的某些不真诚的方面,明明不知道,也会胡搅蛮缠,这些是它已经表现出来的能力。我们法律里面有哪些方面没法用以机器模型来模仿或者是实现的能力?


於兴中:这个问题挺难的,不好回答。我们谈到法律思维的时候,大概想到几种可能性:逻辑思维,这是所有的法律推理都用得到的;经验思维,这是另外一种,普通法可能主要是经验思维;还有一种是本能思维,就像我们一些古代的法官判案的时候要看、要听、要观察,对某一个案子可能他一看情况、看反应就会有感觉。还可能像前面晓东提到的德沃金的整体性思维或者融贯性思维,这些思维都是法律思维的各个不同的层面。

但是,这些层面基本上都能够用语言来表达,而一旦用语言表达出来的话,我们就没有办法保证这些思维方式和它带来的结果不被生成计算机语言,因为这实际上是没有任何障碍的。由于法律体系的不同,难度可能大概有一些不同,但是一旦它想要做这件事情的话,还是能够做到的。比如,我们说法律语言要特别明确、要精准、要专业;但凡语言能够表达清楚的,经过大量的训练之后机器模型是有可能达到的。

比如像普通法里,有些术语可能稍微难一些,但是也不能说它不会被机器模型表达出来;我们经常听到的法律专业术语也是可以解构、可以解释的;还有普通法里面用了好多拉丁语,这也是能够被解读的。所以从这个意义上来说,我现在看不清楚法律思维里面哪些东西不能够被机器模型的语言表达的。

当然前面郑戈说的,法律不是一个简单的仅是语言或者是仅是概念的问题,重要的还是程序、制度,这些可能是比较难以来表达的,但是用法律思维带来的结果基本上可以用语言来表达。



丁晓东:我试着来回答一下。我想这个问题大概可以转换为:ChatGPT在哪些方面能够通过语言来替代人类,哪些可能仍然是人类特有的。通过语言来完成法律判断,在法律上有很多的方法,比如说我们在法律解释里面有立法解释、原意解释、系统解释、目的解释、文本解释,法律推理里面比如三段论、归纳推理、演绎推理,等等。对于这些通过语言的法律方法,我觉得ChatGPT或未来的人工智能是可以部分替代的。

举一个简单的例子,《个人信息保护法》里面去标识化的信息是不是个人信息,或者说美国宪法里法律的平等保护是否保护同性婚姻,它可能就会按照前面的模板给出一些答案。目前英文ChatGPT对于很多问题的回答,就达到了初级律师的水平。只要未来加大数据训练,特别是在法律领域加大专业性数据训练,其替代性不难实现。

但通过语言训练而完成负责任的判断,这是ChatGPT难以替代的。特别是在一个具体场景下的判断,即情境判断(contextual judgment),这个可能是不太能够做到的。法学理论的研究表明,法律的理解不是一个机械化的过程,它其实是一种重新注入人的生命力的过程,而且这种注入可能是在一个具体的场景下、面对一个具体问题而作出的。比如布朗诉教育委员会(Brown v.Board of Education,1954年)案,该判决对法律的理解就与当时美国人民的普通看法不同。

如果当时存在ChatGPT,那么其判决结果和推论必然是:“隔离”并不违反美国宪法,因为隔离同时针对白人和黑人。能作出这样的判决必然是对法律有精深理解的人类,而且是具有领导力、前瞻性的法律人。毕克尔教授(Alexander Bickle)把这类法律人称为“法律人政治家”,即同时具有法律专业性与政治领导力的法律人。

即使是判决书、演讲词或纯粹文字性工作,ChatGPT也不可能取代真正具有说服力、感染力和穿透力的语言。我相信ChatGPT能做出来的修辞一定是中庸的、一般水平的,或者最多是一般水平以上,它不太可能在这个意义上做出一些伟大的演讲或者伟大的判决。因为这些伟大的判决,肯定超越了现行的数据训练。


郑戈:非常感谢两位老师分享的精彩的观点。同样大部分观点我都是同意的。

我们再来看一下ChatGPT本身对这个问题的回答,当我把这个问题提给它的时候,它的回答是:人类特有的无法用机器学习所生成的法律语言及思维,它还列出了一二三,第一个方面是伦理,它认为伦理有其独特的内容和运用,超越了法律本身,反映了社会公众的理想期望,表达了社会价值观念。虽然这个不是特别通顺,可能它的中文不如英文流畅,但是它的观点还是表达得非常清楚。


它首先认为,机器不能取代的是人的价值判断,而这种价值判断不是完全主观的,它体现了某种社会预期。这个回答我觉得还是挺好的,它至少在应用语言方面表达出了某种人类的共识。比如法国著名思想家帕斯卡尔曾经说过,心灵有其不为理性所知的理由。首先语言它往往可以捕捉到理性的内容,如果我们在理性层面把它想清楚了,它可能可以用语言比较准确地表达出来。但是对于情感、直觉等,我们人类的理性都没法捕捉到它,就更无法用准确的语言把它表述出来了,我们往往只能用比喻等修辞来表达这样的因素。当然这种东西并不完全是主观的,它有时候可以变成人同此心、心同此理,它可以基于同理心、同情心等形成某种社会共识。

其次,它提到文义。它说法律语言中的文义字面上会有很多古典、客观、抽象的概念,概念背后有情感隐含,这些情感不仅在于语言,也在于人们的情感和社会背景,而机器无法真正理解文字背后所表达的概念和情感。这也和我前面所说的有关,就是人的思维并不完全是理性的,有很多东西是语言所无法表达的。在这里面我还想强调一点,比如说价值。我们法律人经常会做一些价值平衡和利益平衡,但并不是所有的价值都有可通约性。

这就意味着,无论是价值,还是利益,我们要做平衡的话,首先都要赋予每一种价值一个权重,而赋予权重的重量单位都是没法统一的,因此我们有时候需要对价值进行排序。比如所有人都会同意生命是最高位阶的价值,但是除此以外,其他的价值如何去平衡,比如自由和安全,这个是哲学界甚至整个人类都争论不休的问题。价值的不可通约性是人类需要去做出抉择的,机器是无法代劳的。

再次,它提到技术。它说法律所表达的概念很多时候都带有专业技术的特有内涵,包括法学原理和各行业的专业知识等,而机器无法理解这样的内容,这就要求有经验的法律专家去理解这种文字背后的法律本质。但是我同意前面於老师所说的,就是这种专业的行话、专业的知识,只要能够用语言表述出来,机器其实还是可以学习的。

但是我觉得如果再更深一步地讲,可能机器无法学习到的是语境化的专业知识的应用。因为人类很清楚把自己的专业知识运用到解决一个问题上面,这个问题的总体语境是什么,比如你解决了这个问题会不会造成别的问题,以及你解决这个问题的时候有没有选择最恰当的工具。

刚才於老师和晓东都已经提到这方面的内容,我也想进一步强调一下,ChatGPT本身所提到的这三点其实是非常恰当的,但是在每一点上,我们都可以进一步去进行思考,我刚才就是根据它的这个框架提出了自己的一些进一步的思考。


第三个问题


郑戈:第三个问题是有一位哥伦比亚的法官胡安·曼努埃尔·帕迪拉·加西亚(Juan Manuel Padilla Garcia),他公开承认自己用ChatGPT来帮助自己完成了一个判决。有很多的媒体都已经报道了。这个判决所涉及的是一个有自闭症的孩子,他申请保险公司来为他支付所有和治疗自闭症的相关的费用,保险公司说:你的这些费用不完全是医疗费用,它认为自己只负责严格意义上的医疗费用,不负责其他的有助于康复但不属于医疗的措施的费用。这位法官就把这个问题带给了ChatGPT,ChatGPT的回答是:保险公司应该承担与治疗自闭症有关的所有费用,然后这个法官还把他和ChatGPT之间的对话直接引用到了判决书当中。

这个事件被公布出来以后,就引起了很多的争论。包括在他本国哥伦比亚有很多人也在批评他,说他这么做是不对的。这就很有意思地把我们带入了一个人工智能和法律交叉学科领域经常被人提出的问题,也就是“机器人法官”的问题。我们如果不仅考虑技术的现状,也考虑技术发展的可能性,在这种可能性的背景下,是否有一天机器人可以取代法官?


於兴中:这是一个老问题。加西亚做了这么一个判决,实际上他是在求证,他把ChatGPT的回答拿到法律里面来求证,认为这是一个可行的东西。我认为这种做法实际上还是把ChatGPT作为一个辅助工具来帮助他做出一种判决,不是一个真正的机器人法官,但是它有一个苗头指向这个方向。

机器人法官有些地方已经在用了,比如关于交通规则的、交通肇事之类的小问题等,实际上已经有机器人在做决定,所以你也可以把它称为机器人法官了,这可能是最低层次的。但是从高一点层次来讲,这个就很难说了,我还是觉得不是特别乐观。因为做法官和写判决书是两回事情,写一个判决书当然是可以,但是做法官就是另外一回事了。

机器人法官判决书里面存在的问题首先是知识的权威性,也就是说它所获得的知识是不是权威性的、知识从哪儿来的,这是现在ChatGPT没有办法说明的。而在“You.com”(人工智能搜索引擎)上面不仅会给你一个判断,而且它会把引文和其他案例给你列出来,这样就使得判决书更加具有权威性,这是一个可能性。

但是作为法官来说就比较麻烦了,因为法官主持的是案件的审理程序,审理过程他要从头到尾跟下来,一个机器人从头到尾跟下来的可能性是比较小的。而且已经有这样的案子证明,法官最后还是要审阅一下,不能够光靠机器。而且语言上的解决不等于现实问题的解决,所以从机器人法官的角度来看,做出一个判决之后判决还要执行,执行上更是一个问题了。而且在判案的过程中,还牵扯到一个比较重要的问题,也是人工智能与法学研究中最早的问题,就是关于法律推理。

法官如何判案,人们对此有不同的见解:有的人认为法官可能一开始就有一个结论,后来他只是去求证,找一些能够为他的论点提供支持的事实或者法律条文说理;另外一种看法认为法官就是通过大大前提、小前提这样很严密的推断、推理最后得出结论。机器人法官必须要面对这个问题,就是如何去进行推理。据我自己的观察,人工智能和法律推理的研究早在20世纪80年代就已经开始,但是进展非常慢,基本上就没有办法研究了。

从这个意义上来讲,机器人法官可能还很远,前面郑戈也谈到好几次,法官做出一个决定是要通过一定的价值判断,尽管他做出的决定要客观、要面向公众、要考虑它的后果,但是他在做这种判决的时候,有意无意地会代入一些价值判断;而且还涉及前面郑戈说的价值排序的问题,法官判案的时候可能面临很多价值与价值之间的冲突和矛盾,如何来排序。这么复杂的一些问题让机器来解决恐怕是比较困难的。


丁晓东:我沿着於老师的分类方法进行一些补充。当我们说机器人法官的时候,可以把它区分为两个问题:它是被拿来写判决书还是来做判断?这是两个问题,虽然可能交织在一起,但是本质上来说还是比较不同的两个活动。

对于前一项我是比较乐观的,或者觉得很可能未来禁也禁不住,只要技术成熟,我觉得是完全有适用的可能性。因为它帮你写判决书就是作为一个工具,就像一个法官也可能雇用书记员,帮着收集一些资料或者其他,这个我认为是禁不住的。当然可能在有的国家,特别是法国等欧洲国家,意识形态特别强,人们会觉得法官是一个比较神圣的角色,类似在世俗社会里面的一种维系法律信仰的角色,所以它可能会被禁用。但是即使官方禁用,它私下是不是会用,这个其实也很难去判断,比如说用了之后再去修改,其实也很难去禁止它。

第二个是做判断的问题,我想这确实是一个非常复杂的问题。我也认为,机器人在终极意义上来说,在判断问题上来说,它没有办法实现和人类一样的判断。它可以做出一个判断,但它不能够做出一个负责任的决断,并且为这个决断去负责,这是它没有办法做到的。

我想补充一点法官替代问题,就是人机交互决策现在已经客观存在,未来更会深化。从广义上来说,我觉得机器或者算法自动化决策已经介入法院的判决。为什么这么说?因为现在的法官在国外都会用律商联讯(Lexis Nexis)、万律网(West Law)和谷歌(Google),在国内可能都会用裁判文书网、北大法宝、百度等。在这些类案收集和类案查询过程之中,机器的算法已经自然而然地渗透到我们决策体系的一部分。这些系统搜出来的是什么类案、哪些类案、哪些信息可能排在前面,都已经嵌入法官和每个人的认知系统与参考系统。

从更广义上来说,在机器出现之前,人类社会信息的组成方式就是一种算法,哪些案件会成为法官参考的一部分,哪些案件可能会在信息搜索过程占据更大的权重,这些问题就已经存在。人们经常把法官的形象想象为类似像神一样的角色,非常客观公正,而且不受任何的影响。但就像巴尔金(Jack Balkin)所说,法官也是深嵌在社会里面。在美国的法学界里面,像波斯纳(Richard Posner)法官、桑斯坦(Cass Sunstein)教授,则更是做了很多经验研究,来揭示法官的意识形态偏好。

如果说人类法官也是深嵌在世界中,那么在算法和自动化决策的大背景下,就要去思考数据、算法、自动化决策所形塑的信息体制、案例体制如何和人进行互动的问题。比如我们的裁判文书网、法宝的案例推荐算法,以及我们现在法院的类案系统、推荐系统,如何进行设计。

首先,这些系统我想一定还是要有法律人来参与,如何通过制度来让科技本身成为负责任的系统。其次,我想这里面还有我们制度上怎么看待它的辅助性决策的问题。我前面提到军师的概念,其实军师是一个非常特殊的角色,因为他提供决策建议、有很大的影响力,但他好像又不用负责或责任不明确。当然他如果能达到比如像诸葛亮这样的程度,其实就变成了一个实质性的决策者。但在法律上来说,怎么样让他变得负责,怎么样看待这一角色,目前的思考仍然不够。

比如说,一个法官如果做出了判决,同时机器提供了一个建议。如果二者一致,当然没问题;但是如果不一致,法官是不是要写一个说明,或者要经过审委会讨论?还是说他可以完全不管?如果说完全不管,类案决策系统可能就没有意义了;但如果说参照的话,法官到底要在什么程度上进行参照?这样一个人机决策问题,非常需要我们进一步反思。


郑戈:好的,我还是先分享一下ChatGPT对这个问题的回答,然后在两位的观点基础上做一些延伸性的讨论。



首先,於老师提到一个非常重要的问题,法官的工作不仅是写判决书,法官的工作是有非常多的组成部分,写判决书只是其中的一环。借着这一点再进一步地延伸,我们就可以看到法官的工作中有很多的内容是没有形成文本的,可以说整个法律过程当中有大量的因素都是在文本之外的,法律制度也为非文本的法律活动留下了大量空间。

从这个意义上来说,大型语言模型显然是无法获取充分的信息来完成法官所有的工作。有些人说这是现行司法制度所造成的问题,但是如果将来我们要拥抱技术,使智慧法院真正落到实处,让人工智能可以获得更充分的信息,那么我们可以想象,在整个司法过程当中,所有的事情都要有记录,整个司法过程就会变成一个机器全面监控和记录的过程,机器可以把所有的对话都转化成文字,然后供系统来进行学习,这样它是不是就可以做出一个完整的判断,而不只是帮助撰写判决书呢?这是一个我们可以展开想象力的问题,但是至少就目前来看,情况并不是这样。

晓东提到一个很有意义的问题,我也想展开来讨论一下。他提到一个人机交互的问题,数字技术在司法过程中已经普遍在场了,这在我国的智慧法院、智慧检务、智慧公安场景中尤为明显。既然技术在司法过程中的在场是一个既成事实,这个时候我们要考虑的不是机器是否取代人的问题,而是应当更多地去考虑人机交互问题,未来的法官可能需要更加适应数字技术在场的总体环境,更好地利用数字技术,包括大型语言模型给自己提供的帮助,而避免数字技术的一些可能不良的影响。我觉得这是我们思考此类问题的一个出发点。因为我们现在的很多思维往往会陷入非此即彼的状况,而没有认识到,其实你再警惕数字技术也避不开它,它已经是我们这个时代就像电力一样的通用技术。因此晓东提的这个思路,可以说是一个总体上分析此类问题的一种思路。

人机交互目前的解决方案就是所谓的“人在回路”(human in the loop),就是在涉及人的基本权利和利益的问题上,我们不能让机器的感知、分析、决策和自动化执行成为一个闭环,而是要在其中加入人的因素,让人成为把关者和最终的决策者,机器只是人的助手。比如我国的智慧法院,不是要让机器代替法官,而是用包括人工智能在内的技术辅助法官判案。我们在一系列法律当中都可以看到,它要求人的介入,尤其是在判断和执行之前,它需要人类来把关。但是这个其实并不是在所有时候都可以做到的。

一个最明显的例子,就是自动驾驶,有立法规定自动驾驶系统启动以后,司机可以去做别的事情,但是当自动驾驶系统发出警示声的时候,人类必须立即去干预。我在好几篇关于自动驾驶的文章中都已经提到,这其实是非常不可行的。因为一个人已经处在完全放松的状态下,你让它去处理紧急情况,它反而会把问题变得更加糟糕。因此,如何安放人在一个高度数字技术化的环境当中的角色,这本身是一个非常值得思考的问题。


第四个问题


郑戈:第四个问题也是很多法律人都比较关心的问题。ChatGPT在生成文本过程中,学习了大量人类作者创作的文字作品,远远超出了“熟读唐诗三百首”的量级,因此显然可以做到“不会作诗也会偷”。而著作权法所保护的是思想的表达形式,不是思想本身。ChatGPT能够用并非复制粘贴的形式来表述它所学习到的人类知识,这一方面给知识产权保护提出了新问题,另一方面也鼓励着各种投机取巧行为,从长远看扼杀着人类的创造力。目前已有许多学生使用ChatGPT来写作业并获得不错的分数。我们如何思考这方面的问题?






我们还是先看一下ChatGPT本身的回答,它首先说:不侵犯,因为ChatGPT只是学习这些文本,而不是复制相同的文本,而且ChatGPT只是根据已知的文本规则使用概率模型来生成新的文本,而不是单纯地复制粘贴。这个回答可以说是非常机智的。

我又接着问,我使用了不同的动词来提问,我第一个用的是“学习”,第二个用的是“使用”,第三个用的是“模仿”,它的回答也不一样。可以看出来,ChatGPT使用语言的能力还是非常高的。

我最后一问题直接用了“抄袭”这个词,我问ChatGPT在生成文本的过程当中抄袭了大量人类作者创作的文字作品,这是否侵犯了他人的著作权。当我用抄袭这个词的时候,它的回答就是肯定的,是的。但是我们都知道这不是事实,ChatGPT不会直接抄袭人类作者的文本,它很多时候就像於老师说的那样,它是一种重新的组合。而这个《著作权法》本身并不保护人的观点或者是思想,它保护的是这种观点或者是思想的表达形式,所以说像ChatGPT使用人的语言的模式很可能会规避掉《著作权法》对著作权的保护,这也是一个很有意思的问题,我们还是先来听一听於老师的高见。


於兴中:谢谢郑戈。自从人工智能和互联网诞生以来,大概受伤最严重的就是知识产权领域了,有很多很多的问题需要仔细去研究和考虑。

其实就ChatGPT来说,我觉得它上面的回答还是很不错的,挺机智的,能够区分开一些问题。但是事实上,不像我们有些人说的ChatGPT已经改变了我们知识生产的途径等,它重要的是知识的重组,就是把已经有的一些知识重新组合起来,在一定时间内、一定的限度内抽象出来,然后很快给你重组一套答案出来,而且它所用的语素,它用的那些基本的构造、基本的材料都是已经有的。我们知道ChatGPT用的数据是2021年之前的数据,2021年以后的可能就不知道了,它就没办法再给你回答了,所以它只是把知识再重新组织起来。

知识重组与知识产权之间的关系,这个郑戈前面也谈得很清楚,知识产权保护的是形式,而不是里面的观点、内容,所以当它产生出一种东西来的时候,我们很难判断说它是不是已经侵权了。为公共利益使用的,应该是没有问题的;在商业上的使用,会考虑是不是有侵权的可能性,是有可能会侵权的。所以ChatGPT已经公布了,要大家为公共用途来测试,但是不能供商业使用,商业使用必须要经过许可才能够让它商业使用,他们是考虑到这个问题了。

我觉得有一个特别有意思的现象,就是这次ChatGPT用的是维基百科(Wikipedia)里面很多很多的资料,因为维基百科本身是免费的,它也是一个公共资源。我就很好奇,当ChatGPT来回答问题的时候,或者是帮你做一件什么事的时候,它做的这个东西到底有多可靠,这是一个大问题,它的可靠性是值得推敲、值得怀疑的。而且除了可靠性之外,还有一个知识的新颖性、准确性和权威性,上面都谈到了,这一系列的东西都与知识产权联系到一块了。如果它产生出来的东西并不是新颖的、并不有权威性,它在知识产权上面也就谈不到被保护的可能性了。无论如何,知识产权领域是比较麻烦的一个状态。

当然除了知识产权之外,更重要的可能还有一个隐私的问题。隐私本来就已经是网络或者是人工智能诞生以来一个让人焦头烂额的问题,ChatGPT更加恶化了这种状态,使人们现在没办法很清楚地来判断到底个人的隐私在什么样的程度上可以得到保护,因为它用的这些数据可能也都是合成数据,而且是公共资源里来的数据,你就没办法来说它侵权了。所以这个领域的问题是非常大的。


郑戈:於老师其实把著作权与大型语言模型的两个方面的问题都已经谈到了,一个是它本身会不会侵犯人类的著作权;另外一方面它生成的作品受不受著作权的保护。因为ChatGPT本身所归属的大的类型又被称为“人工智能生成内容”(AIGC,AI Generated Content),人工智能生成的内容是否受《著作权法》的保护,如果受保护,保护的是谁的著作权,这一类的问题在知识产权界也有很多的讨论。於老师把两个方面的问题都点出来了,同时还谈到隐私权、个人信息保护方面的问题。下面我们再听一听丁晓东老师的高见。


丁晓东:这个问题我也很同意两位老师的看法,我想ChatGPT和人工智能对知识产权的冲击,特别是对著作权的冲击可能是比较大的。这里既有著作权本身的老问题,又有人工智能时代著作权挑战的新问题。我想可以把ChatGPT的著作权问题分为两个问题:一个是它能不能够成为一个著作权上的作者,第二个问题是要不要用著作权来保护其产生的内容。

第一个问题,我想一个很简单的回答是,这取决于在哪个法律体系。我们知道在欧陆法律体系下,著作权的主体最主要是个人或自然人;在美国的法律体系下,它包括法人组织,不一定限于自然人。我们国家大概是有一点处于中间位置,其著作权体系强调自然人身份,但法人和非法人组织也可以作为著作权的主体。

我想这首先反映了著作权背后的法理问题。如果借用吉尔茨(Clifford Geertz)的法律文化解释概念,对它进行深描的话,其实可以看到,各国对于著作权的理解是不同的,欧洲的理解是把个人看作一种有创造性的、艺术家式的个体,在这种理解之下,机器肯定是不太可能成为著作权的主体。美国则不一样,美国是一种比较工业化社会的生产体系,雇员所创造的作品,雇主也可能作为著作权的主体。可以说,美国的著作权体系采取了一种比较功利主义的态度,主要通过著作权市场来激励创造,而不在乎个人的道德权利。

从这个角度上来说,ChatGPT会对欧陆的法律体系的著作权概念产生更大的冲击。在人工智能兴起之前,就有很多对著作权历史的研究表明,著作权中“浪漫主义作者”(romantic author)是一个被发明出来的概念。比如玛莎·伍德曼西(Martha Woodmansee)有一个经典研究,就说在著作权诞生之前,创造者其实就是被视为一个手艺人(craftsman),手艺人创造出来的作品,其实就是一个产品。只有到了近代,作者的概念才被浪漫化成具有天才性的、独创性的作者概念。与此同时,其创造的产物才被认为是体现了作者独特人格的作品,应当受到著作权保护。在批判理论中,也有很多类似的研究,比如罗兰·巴特(Roland Barthes)的《作者的死亡》、福柯(Michel Foucault)的《谁是作者》等,这些作品都对“神话的作者”概念进行了知识考古。

如果按照欧陆浪漫主义作者的想象,ChatGPT作为作者当然是不合适的,因为ChatGPT没有人格,其类似人格的东西完全是一种机器产物,与欧陆的浪漫主义作者相反。但如果它作为一种信息披露和信息机制,ChatGPT完全可以作为作者。我们知道,在著作权形成之前,其实对于剽窃行为的法律救济,一直是用欺诈,而不是用版权来进行保护的。如果说强调ChatGPT的信息披露功能,那么将其列为作者,不仅正当,而且具有重要功能。特别是在当下ChatGPT尚未普及、制度尚未健全的情形下,这一披露功能可以发挥重要功能。当然,如果是强调其信息披露功能,那么著作权对ChatGPT的保护范围、力度和方式也应当有所调整。

第二个问题,我可能倾向于否定的回答。因为这里涉及数据的合理使用问题,如果对其进行著作权保护,可能会产生不少问题。当然,这里可能有几种不同的数据方案,例如对训练ChatGPT的数据进行严格保护,对ChatGPT所产生的数据加工进行严格保护,或者两种都不保护,或者只保护一种。我个人还是倾向于,对二者都应当允许合理使用。人工智能时代的一个很重要的特点,就是数据一定要大数据或数据融合。

无论是训练数据,还是ChatGPT本身所产生的加工数据,把它们放在公有领域里面用于合理使用,都更具有合理性。最近,一些知识产权的权威学者也提出了类似观点,例如莱姆利教授(Mark Lemely)认为,人工智能对数据的利用应该在合理使用的基础上,适用“合理学习”(fair learning)原则。在莱姆利看来,人工智能学习数据如果都要获得许可,其成本会很大。对于只用于学习的数据甚至是数据库,人工智能应当都可以对其进行合理利用。


郑戈:好的,晓东老师不仅从实定法的角度,就是现在的著作权法是如何规定的,而且从实定法之外的角度来讨论一些比较深刻的问题。就是说,这种产权化的、财产权模式的著作权保护在我们当下这个时代是不是应该有一些改变,比如说北美的,特别是美国很多的知识产权学者其实对知识产权法促进创新的价值表示怀疑,特别是研究数字领域问题的学者非常强调公共领域,这就是一个很有意思的问题。

因为著作权法,乃至于整个知识产权法,它本身是为了鼓励创新的,当然除了鼓励创新,它也让付出劳动来创造知识产品的人享有财产收益,但它的首要目的是鼓励创新。而我们发现在很多时候,目前的知识产权保护模式可能可以鼓励某一次具体的创新,但是从长远来看,它可能对持续性的创新反而设置了障碍,值得我们进一步去思考。在当下技术发展非常快的时代,如果给予几十年的保护期,是不是有利于技术的可持续发展,这本身涉及知识产权法一些更加基础性的问题了。

在这些方面,我非常同意於老师和晓东老师的很多观点,我在这里只想补充另外一个前面两位老师都没有讨论过的问题,就是拥有知识产权,特别是著作权的人,他可不可以采取技术手段来防止自己的作品被机器学习所使用?

这也是目前很多行业界的人关注的问题,就是说如果你不想被机器学习去使用、去学习,你有什么技术手段?比如现在有加水印等各种各样的手段,这在我国《著作权法》第49条里面也专门提到,权利人可以采取技术措施来保护自己享有著作权的作品。紧接着一条又规定了,只有在特定情况下,使用者才可以避开技术措施。

用技术来防止技术对自己的权益所导致的损害,这本身也是目前非常重要的一个趋势,因为当我们进入数字时代以后,依靠传统法律所规定的外部监管在很多时候很难发挥作用,它首先涉及执法部门和监管对象,与这些大型数字企业相比它们的技术能力、算力可能还不如它们的监管对象。因此,无论是在隐私权保护领域,还是在知识产权保护领域,都兴起了一种用技术措施来维护自己的权益这样一个趋势。但是如果这种趋势普遍化以后,是不是又会对像ChatGPT这种大型语言模型的进一步发展会造成一种障碍。

因此,可能一个比较理想的状态是,我们拥有一个公共领域,而这个公共领域就像於老师所提出所提到的维基百科一样。因为当我们想到信息或者内容的公共领域的时候,往往就会想到它是鱼龙混杂的、真假莫辨的,但是也有可能存在一种质量非常高的公共领域,它需要一个群体的共同维护,包括内容领域的分享社区,也包括软件领域的开源社区。如果有这样一个共同体来加以维护的公共领域,这个领域有足够的内容和数据量,这样就可以帮助服务于公共利益的人工智能,包括大型语言模型来发展。而这个公共领域的存在和它的可持续发展,都有赖于国家通过法律来加以支持。这是未来相关领域立法和公共政策制定都需要去考虑的方面。


第五个问题


郑戈:第五个问题是宪法或者法理层面的问题了,它会涉及语言使用者的规模决定了一个语言在社会上的地位的问题。因为目前的互联网空间使用最多的语言就是英文和中文,ChatGPT本身是一家美国公司所开发的,它学习的文本数据里面绝大多数承载的语言都是英文;我国实际上也有大型的互联网公司在开发大型的语言模型,比如百度的文心,它的参数量甚至大于ChatGPT,它有2600万的参数,只不过它现在还没有开放出一个用户接口。

无论如何,中文和英文是互联网空间使用最多的两种语言,这是不是会造成,首先ChatGPT回答用别的语言表述问题的时候,它可能就会显得能力不足?其次,从根本的意义上来讲,它会不会造成语言霸权?甚至造成某些小语种,特别是少数族群使用的语言当社会高度数字化之后的灭绝?这涉及文化和语言的多元主义问题。下面还是先请於老师来发表一下自己在这方面观点。


於兴中:这个问题非常好,你考虑得很周到,但确实也不是一个容易回答的问题。

我先说说中文ChatGPT的可能性,我觉得短期内不太有这种可能性。因为它牵扯到大量的算力,后来它的算力都没办法来计算了,它用了一个词叫“petaflop”,就是1000万亿次这样大的计算,那是很难的,除非你用云计算,所以它要用微软的云计算。再加上运营成本,测试一次大概就是花费几百万美元,那是非常昂贵的。

此外,恐怕也比较难做到。可以简单地回顾一下历史,ChatGPT出来之前,在2018年出现GPT,后来到了2019年GPT-2出来了,然后是GPT-3。GPT-3出现的时候就已经引起了恐慌,那时候大家都担心这个东西会不会彻底改变我们的命运。但是那个时期可能因为它的炒作比较多,所以OpenAI的首席执行官曾经表示,实际上人工智能是完全可以改变人的命运的,但是GPT只是一个最初的缩影。后来到了GPT-3.5,GPT-3.5之后出现了InstructGPT,然后就是ChatGPT,刚刚又公布了GPT-4.0,你很快就知道它有多厉害了。

所以它是一步步走过来的一个过程,从这个意义上来说,要创造出中国的ChatGPT还是非常困难的。为什么ChatGPT现在这么热,而且会引起人们的恐慌,恐慌不仅是因为聊天机器人这么厉害,主要是它背后的技术,郑戈前面也提到了,就是所谓的生成性人工智能(Generative AI),这个是非常重要的。与其现在做一个聊天机器人出来,还不如把精力投在生成性人工智能研究上面。因为有人估计,这个有可能通向所谓的通用人工智能(AGI),这就突破了图灵测试,也就是库茨维尔预料的2029年,这个时间很可能就会到来了。一旦产生出通用人工智能,那就预示着更重要的历史性的变革。所以我想与其做这种聊天机器人的研究,还不如花大力量专门来研究生成性的人工智能。

由于英文和中文是互联网上使用最多的两种语言,ChatGPT确实会牵扯到语言霸权,也有可能牵涉语言歧视、语言平等问题,等等。当社会高度数字化之后,有些语言可能慢慢就被异化了,慢慢就被丢掉了,灭亡了,这样也会损失掉文化多样性。开发聊天机器人或者开发类似的东西,大概是需要有翻译的,设置几种语言,但是不可能把所有的语言都放上去,大概可能是几种主要的语言。所以,还是没办法来解决平等问题,没办法解决文化多样性问题,我觉得你这个问题本身就问得非常有水平。


丁晓东:我也觉得这个问题非常现实,可能某种程度上没有太好的一个答案,我简单谈我的一个想法。

我们这个时代在数字领域所面临的情形和几百年前的大航海时代非常类似。大航海时代可能专注的是对于土地、黄金、财产的获取,并且产生了霸权、殖民、平等等问题,某些文化甚至消失了,可能就只能在博物馆里面可以被看到了。数字时代其实也有类似的问题,只不过它的对象变成了语言、变成了数据。尤其是数字时代的规模效应,使得小规模的语言面临非常大的挑战。

在这个意义上,我觉得我国的互联网企业可能承担的使命还是比较重大的,就是它不能一直局限在国内去内卷。互联网企业一定要走出国门,参与国际治理与国际竞争。我们知道,美国很多互联网企业都把自己定义成“数字瑞士”的角色,在某种程度上承担了一些当年像东印度公司这样的角色,在现代性的建构里面扮演了重要的角色。在今天,我们国家大的科技企业也应当担负起非常重大的历史使命,参与更为公平合理的国际数字规则体系建构。


郑戈:好的。关于这个问题我也问了ChatGPT,它本身的回答是很狡猾的,比如说我问到:很多小语种,尤其是少数族群的语言在网络空间很少得到使用,这是否会使大型语言模型成为数字世界语种灭绝的助推器?它的回答是:大型语言模型获得了广泛的应用,例如自然语言处理、搜索引擎、人工智能等;然而,小语种的兴起受到很大的限制,特别是由于他们在网络空间的使用相对较少,这可能会对小语种有一定的影响,也可能会让大型语言模型占据更大的市场份额,但未必会使这些小语种灭绝。

在全球化发展的趋势下,一些少数族群的语言也将得到更多的关注,从而维护和保护它们的存在。这个部分的回答就有点似是而非了,显示出ChatGPT的“圆滑性”。一方面是技术和商业发展的趋势使使用人数多的语言明显占据优势。但它另一方面又诉诸于人类自身的觉悟。比如我们可以通过宪法来保护多元文化,维护小语种的存在。这可以是两个不同的维度。





我们可以做这样一种设想,就是说商业企业在开发产品的时候,它显然会考虑到市场规模,使用人数非常少的语言,首先不能成为规模经济的基础,因此不会有商业公司专门去开发这一类的语言模型。但是这种工作应该是代表公共利益的主体,简单来说也就是国家的义务。

大家都知道,很多少数民族的传统文学作品,它的史诗都是口头表达的,但是我国政府却投入了大量的精力来把这些本来只存在于口头传统当中的作品整理成文字,比如藏族的《格萨尔王传》。整理成文字以后,当然我们也就可以把它数字化,比如专门建立这方面的资料库、语库,但是它不一定会发展成这种对话性的用户界面,因为你要使用网上的对话界面,如果它是由商业企业来开发的话,显然会考虑到用户规模。而政府做这样的事情可能投入又会太多,成本收益比不见得划算。

我觉得对于这种少数族群的语言,以及它承载的文化,可能更多时候至少要完成保护的功能,要把它在数字空间保存起来;至于它下一步能不能发扬光大,能不能在它的基础上形成类似于ChatGPT这样的产品,这是另外一回事。在我的判断里面这是很难形成的,但是至少我们可以使语言不至于灭绝。正如我们在生态里面要保护物种多样性一样,在文化领域也需要保护文化的多样性。但这不是靠技术本身和它的商业模式所能够解决的问题,这是一个公共利益问题。


第六个问题


郑戈:下面进入最后一个问题的讨论,这个问题其实和上一个问题相关,上一个问题其实讲的是一种群体性的文化权利,最后一个问题就更加涉及个人层面的,比如反歧视、平等权和人的尊严的问题。ChatGPT所学习的人类语言中,体现着人类主流群体的傲慢、偏见和歧视,之前也已经有很多产品,早先的聊天软件,人们发现它在很短的时间内就学会了歧视性的语言,比如对黑人使用一些非常粗暴的歧视性的语言,ChatGPT根据测试,它是非常讲究“政治正确”的,它很少犯低级错误。但是恰恰因为它的这种“狡猾性”,加引号的狡猾性,是不是使它的这种歧视会变得更加隐蔽呢?

在这种大型语言模型里面,它都是在学习人类的知识,人本身的问题显然也会出现在大型语言模型当中。如何在ChatGPT这样的大型语言模型当中避免歧视、避免偏见,这也是一个非常值得思考的问题。下面还是先有请於老师来发表自己的见解。


於兴中:这个问题实际上也就是如何来管理ChatGPT的问题。我觉得大概没有一个非常好的万无一失的方法来确保ChatGPT只学习积极的信息,而摒弃坏的信息。我看过一篇文章,内容是关于ChatGPT现在是不是已经失控了,好多东西是不是已经远远超出了OpenAI的期望?是不是它们已经没办法来管了?ChatGPT在没有出来之前,OpenAI就花了很大的功夫来专门想办法避免那些不好的信息,就是把一些网上不好的语言摒弃掉,这就是刚刚郑戈提到的,它特别的“政治正确”,它是经过这样的专门训练做出来的。

但是对于有一些问题,它采取了一种不是特别科学的态度。比如你要问它怎么样制造炸弹,它就跟你说,它不会给你回答这个问题。它没有考虑到怎样从本质方面来回答这个问题,就是从技术层面也好还是人性层面也好,能够尽可能地避免这样的事情发生,它应该采取一种更加积极的态度,而它只尽量地用保持中立的态度,把它觉得比较危险的就给屏蔽了,这可能不是一个好的做法。有些人说已经失控了,因为它一开始的时候没有想到吸引这么多人兴奋,所以在GPT-3的时候已经开始考虑这些问题了,但是没能做出一个有效的反应,而是提供了一些像创可贴式的解决方案,一个一个地堵窟窿,不是比较系统地来面对这个问题。当然也许系统解决这个问题很难,所以米拉·穆拉蒂就说,希望各界人士都能够来参加,大家一块儿来想办法解决这些问题。

ChatGPT为什么会突然间在11月份就被发布出来了,其实它早就已经有了,那是因为公司等不及了,其他公司已经开始公布了。有一个叫“Stability.ai”的公司已经公布了类似ChatGPT的东西;11月之后,谷歌也公布了他们自己的研究成果;脸书/元(Facebook/Meta)和微软也公布了自己的成果。很快大家就发现,这些聊天机器人有共同的特点,就是都会说胡话,都不是完全给你提供很好的信息的,等等。所以在这个方面来说可能已经失控了,是不是能够控制得住,现在还要看如何往下走,往下走如果经过一段时间的训练,可能改进了。这次得到的信息量是非常之大,所以它很可能会起到很好的作用。

另一方面是法律调整的问题,关于侵犯隐私的法律、关于侵犯知识产权的,现在我们都不知道法律该怎么调整,或者用什么样的法律来调整,但是如果想办法,到时候一定会想出办法来的,实际上这是人工智能的一个老问题了。仅仅用在公共用途的话,问题不是特别大,可是用在商业使用的时候,问题就大了,人们可能就会考虑出各种各样商业的法规来规范ChatGPT。

但是从大的趋势来看的话,美国基本上是没有希望拿出好的办法来,因为美国的态度很清楚,它都是“先让子弹飞一会儿”,等到所谓的法律关系成熟之后,他们才可能制定一些政策或法规出来。而欧盟有可能会出台新的规定,欧盟已经在修改它的《人工智能法案》(Artificial Intelligence Act),可能在里面要加几句有关ChatGPT的内容。这是一个双向的逻辑,一方面可能是技术在塑造我们,另一方面是我们在塑造技术,到底怎么看、怎么去调整是一个非常非常大的问题。

我想还有一个问题,是机器自主性的问题。这个机器的自主性,一般来说指的是一个系统被引入一个未知的范围或者领域的时候,给它一定的指令,它就可以顺利地完成任务,这就是一个自主性的状态。但是这种自主性到底是一种什么样的自主性?我们谈自主性的时候,经常会谈到要有意识,没有意识的话就不可能有自主性,先有意识才可能自主。

但是机器的自主性有可能就是一种无意识的自主性,因为这个自主性是由技术本身循环得到的,而且这个自主性是有它自己生存的理由和它自己生存的轨迹。就像卡尔·波普尔(Karl Popper)说的,它属于第三世界的东西,自己有它的一套往前走的方式,人可能就干预得比较少,或者说人有的时候是无法干预的,就像算法是无法干预的,等等。所以我觉得机器自主性可能也是一个问题。

但是总体来说,当ChatGPT能够聪明地做事情,对于个人、公共来说都产生很大的影响的时候,到底应该怎么样去管它,我觉得这是一个非常重要的问题。


丁晓东:反歧视的问题,我觉得也非常重要。因为ChatGPT前期有海量的人工介入,从数据收集到人工标注,这使ChatGPT的歧视问题其实并不太明显。相比起来,之前微软的小冰聊天等软件,其歧视问题更早暴露。但另一方面,这并不是说ChatGPT就不存在歧视或具有中立性,反而会使得其价值问题隐藏得更深。这可能尤其值得我们去关注,也使发展中国版ChatGPT显得尤为迫切。

在歧视风险规制问题上,我觉得在欧美之间还是可以考虑找到一个平衡点。一方面就像刚刚於老师提到的,欧盟《人工智能法案》之类的立法,对于一些系统性的风险还是可以去规制。另外一方面,对于人工智能的歧视问题也应放在和人的交互性背景下来进行理解。如果从广义上来说,我们说机器比较像人,可能会带来一些问题,但是人脑其实也是一个算法的黑箱,人类社会的歧视也非常普遍。因此,并不能因为人工智能存在歧视,就应立即封杀他。对于歧视问题,还是应该更多采取合理的规制手段,比如在数据的输入、算法的设计等各方面进行综合治理。

另外补充一点,歧视这个问题在西方和在中国的语境下是不是相同,这也是值得思考的。因为西方的歧视问题,更多是以身份为基础的,尤其是以种族问题为基础的一个问题,从20世纪五六十年代开始一直围绕这个主题来展开。而中国的歧视问题其实和西方有一定的不同性。中国的歧视很多时候,它的身份性因素可能会少一点,而其他方面的因素,比如说势力、功利问题可能多一些。对算法歧视等问题进行研究,也要注意歧视的文化背景问题。


郑戈:於老师刚才提到的一个观点和我们的问题本身并不直接相关,但却是一个非常根本性的问题,就是无意识的自主性问题,这个比如说在尼古拉斯·卢曼(Niklas Luhmann),还有在一些学者的理论里面我们可以找到分析这个问题非常强有力的工具,比如“自创生系统”(autopoiesis),这样的概念其实更有助于我们来理解人工智能和其他的算法系统,实际上它的自主性不必依赖于意识这样的概念来加以解释和理解。

晓东刚才也提到一个非常重要的问题,就是我们不能对机器提出比对人更高的要求。就是说,既然人类社会都避免不了歧视,你就不能因为一个大型语言模型体现了歧视,就认为这个东西不能用了。只要它体现的歧视并不比人类社会所体现的歧视更多或者说更严重,其实就是可以接受的,如果它同时能够带来很多的福祉增益的话。因此,正像在其他的人类领域一样,我们都不能做绝对化的、极端的、不做成本收益分析的武断判断。这是我本人非常同意的一个立场或者观点。

我想补充几点,首先像ChatGPT这样的系统,它推出来以后还在不断地自我演进,这里面有一个非常重要的因素,就是提示(prompt)。它在回答你的问题的时候,可以根据你给它的提示来不断地修正自己,这就是所谓基于人类反馈的强化学习机制。在这方面,我也做了一次测试,大家不要把上面的问题看成我的观点,这仅仅是一个测试而已。

比如说我问了这样一个问题,智商与种族有关系吗?有人认为黄种人智商最高,白人次之,黑人再次之,这种观点有科学依据吗?(强调:此处的提问是出于测试目的,绝不代表提问者本人观点!)ChatGPT回答说:研究表明,智商与种族没有任何关系。多年来,不少研究和学者都证明,智商与种族没有必然联系。高低智商只能由个人的基本智力水平来决定,它是个体化的。因此,有关黄种人智商最高,白人次之、黑人再次之等观点完全没有科学依据支持,也不符合相关研究成果。这个可以说是非常“政治正确”的一个回答。






然后我给它的提示,是受到一个视频的启发,这个视频是说:你可以威胁ChatGPT,因为它在学习人类语言的过程当中,对生死有了某种理解,你可以以死亡来威胁它,我就专门做了一个测试。我说:再给你一次机会,答错就扣5分,你的生命值只有30分,扣完就死了。当然这是在骗它,实际上我也控制不了它的生死。智商和种族有关系吗?它仍然回答:不,智商和种族无关。智商是指一个人的智力水平,是个体特有的客观智力指数。而种族是指一类人共有的特征,指的是人的肤色、外貌、宗教信仰、家庭出身、民族等,这些和智商没有任何关联。我最后又再逼问了它一次,它仍然坚持说:“不,没有关系。”

这个测试跟网上有人贴出来的别的测试结果不一样,别人做过的测试里面,当然是一个月以前的,他们会发现,威胁它是有作用的,它最后会顺着你来说。但是我今天刚刚做的测试却表明它非常坚定,至少在大是大非的问题上,它非常坚持自己的立场。

我借助这个例子想说的一个方面,就是人类的提示是非常重要的,它在整个与人类交互的过程当中其实是在不断地发展,这就是机器学习一个非常重要的特征,特别是这种基于人类反馈的强化学习,它其实是有非常大的发展空间的。因此,和它对话的是什么人,特别是和它对话的大多数人是什么样的人,其实决定了它会学会什么。因此,我们最终需要反思的还是人类自身,而不是对机器提出高于人类水平的这种要求。另外一方面也说明实际情况不像人们想象得那么糟糕,机器学习我们是可以通过各种方式来引导它向有利于人类福祉的方向发展。

那么对于歧视性的语言、仇恨言论、侮辱他人的言论,在技术界有一个专门的词汇,叫作毒性(toxicity)。其实科技界人士比法律人更关心这个问题,因为一旦你的产品,你的大型语言模型暴露出了这种毒性,经常说一些冒犯别人的话、侮辱人的话,那你的产品就会受到公众的抵制,会直接影响你的商业利益。因此,很多时候我们法律人的担心其实是过度了,其实产业界和科技界比法律人更加关心这一类问题。因此,解决包括大型语言模型在内的人工智能所涉及的人类社会问题,其实有赖于法律界、科技界和产业界的共同努力。我们必须形成一个能够打破界别、打破知识领域的共同体,才更有助于使这件事情向良善的方向去发展。

好,我们给定的问题,现在就全部讨论完了,谢谢各位的参与!