立法运用大数据的空间与限度

2020-09-24
24 2020-09

21:58

分享
来源:《行政管理改革》2020年第9期作者:周婧

[摘要]在大数据时代,海量多样且时时更新的大数据既能及时展示特定领域的具体变化,又能反映社会整体的状况与趋势,为立法者进行系统评估、做出周全决策提供强有力的支持。运用大数据不仅有助于提高立法工作效率,还有助于推进依法立法、民主立法、科学立法。大数据具有助力立法的功能,但此功能是有限度的,大数据是立法的辅助者,而不是决策者。立法运用大数据的重点在于立法资料梳理、立法意见分析和方案评估等环节,要进一步明确立法需求,推进数据共享,提升技术水平。

[关键词]立法;大数据;科学立法;立法技术

[中图分类号] D63 [文献标识码] A

  随着互联网的广泛应用,大数据的来源越来越广泛,数量呈爆发式增长。计算能力的提高和人工智能技术的不断突破更是助力大数据技术的发展,人类获取、存储和处理分析数据的能力极大提升。大数据逐渐被运用于科学研究、商业往来和国家治理等各个领域,大数据时代的到来是不可逆转的事实。[1]

  大数据不仅能够促进经济发展,还有助于保障改善民生、提高国家治理能力。要充分发挥大数据的作用,需要明确数据权属、确立数据使用规则、完善数据产权保护和个人信息保护制度。与此同时,作为重要的基础性战略资源,大数据有助于增强公众参与立法的有效性,提升立法决策的科学性。一方面,大数据的发展应用需要立法保驾护航;另一方面,立法质量和效率的提升需要发挥大数据的作用。基于此,有关大数据与立法的研究可分为两类。一是将大数据作为立法的规范对象,探讨如何进行大数据立法,以促进大数据的发展,防范大数据带来的风险。二是将大数据作为立法的新工具,分析在立法过程中如何运用大数据,以提高立法的质量和效率。已有研究主要集中于大数据立法,不仅系统分析如何保障数据安全、保护数据权利、确定数据标准、规范数据行为、监管数据平台、防止数据垄断等,而且深入探讨大数据立法的路径和方法。[2]相比而言,现有研究对大数据在立法中的运用关注较少。基于此,本文将在梳理大数据特点的基础上,探讨大数据在立法中的应用空间,分析大数据助力立法的功能及其限度。

  一、大数据的特点及其与立法的关联性

  大数据不是一个新名词。20世纪90年代中期,诺贝尔奖获得者吉姆·格雷(Jim Gray)就指出大数据的挑战将会首先来自科学而非商业。1997年10月第八届电气电子工程师学会(IEEE)可视化会议上,迈克尔·考克斯(Michael Cox)和戴维·埃尔斯沃斯(David Ellsworth)发表的论文提到,可视化给计算机系统提出了一个有趣的挑战:数据集通常很大,使主存储器、本地磁盘和远程磁盘负担过重。我们称之为大数据问题。[3]随着计算系统算力的提高和人工智能技术的迅速发展,人类理解、获取、处理和组织数据的能力不断提升,已在一定程度上解决了上述问题。

  那么,什么是大数据(Big Data)?大数据是指数量巨大、速度快捷、种类繁多的信息财富,这些数据需要新的技术手段来处理,以便提高决策制定、领悟发现以及过程优化等能力。[4]与传统的“小数据”相比,大数据具有以下三个特点:

  一是海量性。随着网民规模和互联网普及率的增长,电子商务兴起,社交网络也逐渐成为人们交流交往的重要方式。企业和公共机构的信息化水平不断提高,产生的数据量也随之增加。加之,物联网、云计算等技术的快速发展,数据量更是呈现指数级递增。据国际信息技术咨询企业国际数据公司(IDC)的报告,2020年全球数据存储量达到44ZB(1021),2030年将达到2500ZB。我国的海量数据更是快速增长,2020年数据总量达到8000EB(1018),占全球数据总量的21%,成为名列前茅的数据资源大国和全球数据中心。[5]

  二是多样性。大数据来源广泛,种类多样。在经济领域,不仅有传统企业在设计、制造、再利用产品过程中形成的大数据,还有互联网企业的移动支付、网络征信、电子商务等大数据。在社会领域,随着互联网用户数量和使用频次的增加,网络日记、社交媒体、互联网搜索等数据量飞速增长。在国家治理领域,立法机构的公众互动平台、政府部门的政务服务平台、法院的裁判执行相关平台、检察院的检察服务平台等都形成了海量数据。

  三是时效性。计算科学在微处理器和纳米电子技术方面的突破促使计算机更加微型化、高速化和智能化,极大地提高了计算机的运算处理能力。这使得人类能够在短时间内收集海量数据,大数据还能根据变化及时更新。而且,人类能够迅速对大数据进行处理和分析,得出相应的结论。由此,大数据具备了很强的时效性。

  海量多样且时时更新的大数据既能及时展示特定领域的具体变化,又能反应社会整体的状况与趋势。这为立法者进行系统评估、做出周全决策提供了强有力的手段。具体而言,大数据是海量的,这使得人们能够通过大数据了解特定现象的方方面面。诚如吉姆·格雷所言,大数据技术使得研究者得以处理同某个现象相关的几乎全部数据,大数据之“大”,就在于“样本等于总体”。[6] 这和抽样调查显然不同。抽样调查是从对象总体中选取一定数量的样本进行调查,再根据调查结果推断对象总体的特征。抽样调查并非全面调查,其结论的可靠性取决于抽选的样本是否具有代表性。如果说抽样调查勾勒的是局部图像,那么大数据呈现的就是全景图。这使得立法者能够更加全面地了解立法事实,更加准确地判断事物发展的态势。

  大数据是多样的,涉及经济、政治、社会、文化等各个领域。这使得立法者可以从各种类型的数据中,获取有价值的数据,并对这些数据进行分析处理。通过大数据分析,立法者能够判断特定事物对社会的各领域、各方面、各层次产生何种影响,对其后果进行综合评估。通过大数据分析,立法者能够厘清不同群体各自的观点、立场和诉求,发现不同群体的争议点。如此一来,立法者所了解的事实不仅仅涉及某个方面,而是覆盖社会的方方面面。立法者所掌握的情况就不是单一维度的,而是多维度的、立体的。立法者也就能够在综合考量诸多因素、权衡不同利益之后,做出合理的决策。

  大数据时时更新,具有时效性。通过收集和对比大数据,立法者能够迅速了解事物的变化。通过大数据分析社会新近的变化、面临的挑战,立法者能够及时回应社会的需求,及时对法律制度进行调整。通过大数据跟踪分析,立法者可以判断事物变化的轨迹,探知事物发展的规律,制定行之有效的法律规范。

  二、立法运用大数据的重点环节

  立法是一个复杂的系统工程。就流程而言,立法包括立项、草案起草、草案审议、草案表决和法律法规公布等环节。其中,前三个环节是提高立法质量和效率的关键,都涉及立法资料梳理、立法意见分析和方案评估等子环节。这三个子环节是立法运用大数据的重点。

  立法资料梳理是立法的基础性工作,是制定良法的前提。立法资料包括学者的相关研究和国内外相关立法。运用大数据有助于提高立法资料梳理的效率。在人工智能技术的助力下,运用大数据不仅提高了查找相关研究成果的便捷度,还能对研究成果进行简单分析,提高成果应用的效率。此外,有了大数据,用关键词自动检索能够迅速地找到相关立法。例如,运用北大法宝自动检索不仅能搜索到相关法律、行政法规、司法解释、部门规章、军事法规规章、党内法规以及外国法律法规,还能搜索到一些立法背景资料。这比以前一个个国家、一部部法律查找便捷许多。在运用大数据技术查找相关立法背景资料的基础上,梳理国内外相关立法的具体规定和产生背景,深入分析影响法律规范的经济社会文化因素、法律规范发挥的功能效用,有助于明确能否以及如何借鉴国内外相关立法。

  立法意见分析是立法的重要环节。这不仅是民主立法的必然要求,也是聚民力、汇民智、提高立法科学性的关键所在。分析立法意见首先要收集意见。立法意见的来源主要有四个方面。一是立法调研。立法调研是立法机关了解实际情况、发现存在问题、寻找解决方案的重要方式。通过立法调研,立法机关了解相关监管部门、专家学者和立法涉及的个人、企业、群团组织等利益相关者的意见建议。二是草案征求公众意见平台。目前,全国人大常委会、许多省级人大常委会和部分市级人大常委会在门户网站上设立了法律法规草案征求公众意见平台。公众可以直接通过该平台,向人大常委会提交对某一法律或法规草案的具体意见。对于一些和公众关系密切的法律法规草案,公众提出的意见数量较大。如民法典婚姻家庭编(草案三次审议稿)征求意见时,有213,634人提出了276,948条意见。(注:征求意见参与人数和意见条数可参见中国人大网,http://www.npc.gov.cn/flcaw/more.html,2020-08-20。)三是问卷调查。有的人大常委会还通过网站和报纸发布立法问卷,针对法律法规草案中争议较大的事项进行调查。比如,上海市人大常委会在网站上设立“问卷调查”栏目,集中发布法规草案调查问卷。四是媒体和自媒体。法律法规草案发布之后,媒体通常邀请专家发表专业意见,对公众进行相关采访。一些关注特定立法的人士通过微博、微信公众号等自媒体发表的意见也会引发公众的热议。提出立法意见的主体多元,渠道多样,信息分散。运用大数据技术能够将来源于不同平台、不同网站、不同渠道的立法意见都收集起来,既提高收集速度,又保证信息完整。

  收集立法意见之后,需要进行分析。运用大数据技术,对已有信息、数据进行挖掘,发现草案中争议较大的点,并对各争议点的不同意见进行分析,将意见进行归类。归类之后,一方面梳理出解决争议的多种方案,比较不同方案的异同;另一方面,通过对提出或赞成同一类方案的人的职业、地域、阶层等特征进行统计,以量化的方式把握不同群体的观点和诉求。在此基础上,判断哪些立法意见应当采纳,哪些利益需要重点考量,哪些解决方案可以优先采用。

  无论是立项,还是草案起草和审议,都需要对不同的方案进行分析和评估。评估的内容主要包括两个方面,一是审查方案是否符合上位法,二是判断方案是否科学合理。审查方案是否符合上位法,首先要找到相关的上位法。运用法律法规数据库的自动检索能够提高查找的效率和准确度。然后进行智能比对,不仅减少立法者的工作量,而且确保没有遗漏。判断方案是否科学合理,需要考量方案的必要性、可操作性和实施效果。实践中常用的是立法评估和立法后评估两种方式。在立法评估中,借助大数据可以根据立法所涉及对象的特征进行分类,再运用算法模型分析不同方案的实施效果。例如,依据不同税率对应的全年应纳税所得额将纳税人分为七类,再根据全国纳税系统的数据,运用算法模拟不同的税率方案对七类纳税人产生的影响,分析不同方案的实施效果。精准的数据分析取代立法者的主观经验和直觉判断,能够提高评估的可靠度和论证的说服力。在立法后评估中,运用大数据技术爬取已颁布的法律规范的有关数据,借助人工智能技术分析法律规范实施对经济、社会、文化等领域产生的影响。在此基础上,结合执法、司法相关数据和执法检查、公众满意度等数据,能够对法律规范的实施效果做出较为客观的综合评判。

  三、立法运用大数据的优势与挑战

  随着计算机技术、云计算、人工智能等技术的发展,数据收集、存储、传输和分析过程发生了重大变化,其成本越来越低,效率和能力则不断提高。通过大数据挖掘,能够从看似不相关的数据中发现数据的相关性,发现数据世界所对应的事物的特征和规律,进而制定合理的法律法规对事物进行规范和调整。

  (一)立法运用大数据的优势

  立法是法治的起点,是发挥法治促进和保障经济社会发展作用的前提基础。要促进和保障发展,需要解决面临的问题和挑战。不同的国家、地区面临的问题虽有差别,但也有共性。参考其他国家地区的法律制度,借鉴其他国家地区的成熟经验,对于提高立法的质量而言不仅必要,而且重要。运用大数据技术收集其他国家地区的法律文本、立法背景资料,能大大地节省立法者查找资料的时间和精力。人工智能技术的发展和应用提高了自动翻译的准确率,让立法者可以直接找到相应条款,缩小了立法者的文本阅读范围。此外,大数据技术的应用提高了收集和分析立法意见的效率。较之人工归集整理,无论是运用大数据技术收集人大常委会的征集公众意见平台信息,还是收集网上问卷调查的信息,效率都更高。在收集数据的基础上,基于深度学习的人工智能技术还能对公众意见进行智能分类,减少了立法者的工作量,提高立法工作效率。

  除了提高立法工作效率,运用大数据还有助于推进依法立法、民主立法、科学立法。

  一是促进依法立法。运用大数据技术,不仅能够快速检索到相关上位法,还可以对立法草案的条款与上位法条款进行智能比较,精准配对,标注出审查的重点。智能比对应当对立法草案各条款是否符合上位法进行更为全面仔细的审查,避免出现疏漏。标注审查重点提醒立法者对特定条款进行更为细致地审查,保证立法草案符合上位法,确保依法立法。

  二是助力民主立法。在互联网广泛运用的当下,通过人大常委会的征集公众意见平台发表意见、参加网上问卷调查和网上听证会等已成为公众参与立法的主要方式。对公众意见通过智能终端自动生成的数据进行处理,一方面梳理出公众对各个条款的意见建议,预测公众对各个条款的满意度;另一方面分析提出意见建议的公众的职业、地域、年龄等特征,细化不同群体的利益诉求,评估不同群体与拟设定法律制度的利益相关性。而且,运用大数据技术跟踪社会舆情,挖掘媒体、自媒体的相关信息,分析公众对立法草案的关注点和争议点,也可以把握公众的利益诉求和价值取向。如此一来,对公众意见的分析更为细致,对不同利益的考量更为全面,对公众意见的采纳也更为合理,有助于更好地坚持立法为了人民、依靠人民。

  三是推动科学立法。运用大数据查找到其他国家地区立法之后,收集立法的相关数据进行分析,理清法律规范产生的背景、立法目标和实施效果,对于借鉴立法经验具有促进作用。此外,运用执法、司法数据,了解法律实施过程中遇到的难点堵点,明确立法的具体目标。深度挖掘立法涉及的企业、行业、产业相关数据,把不同领域的问题加以量化,将风险加以细化,准确把握实际情况,提高立法决策的合理性。用大数据改进调研决策的方式方法,将社会不同群体的需求用数据呈现出来,将论证过程加以量化,助力科学立法。

  (二)立法运用大数据的挑战

  发挥大数据助力立法的作用关键在于“让数据说话”。在大数据时代,我们并不需要预先做出理论假设,而是通过对已经存在的大数据的挖掘和分析,就能够发现其中蕴藏着的知识或规律。[7] “让数据说话”就是要发现特征,得出规律。那么,如何“让数据说话”?

  要让数据说话,得有海量数据。没有海量数据,难以发现数据背后的特征和规律。退一步而言,即使发现了,其可靠性也难以保证。那么海量的数据从何而来?数据首先来自于立法机关本身。2015年《立法法》修改,将地方立法主体扩大到设区的市的人大及其常委会。2018年3月11日,十三届全国人大一次会议通过宪法修正案,明确了设区的市的立法权,为设区的市立法工作提供了宪法依据。我国地方立法主体增加到354个,包括31个省区市、289个设区的市、30个自治州和4个不设区的地级市。[8]全国人大常委会和具有立法权的地方人大常委会基本上建立了立法数据库。但是,数据库的信息存在不够全面的问题,比如,全国人大常委会和地方人大常委会的法律法规数据库都没有收录不报其备案的法规、规章和规范性文件。而且,不同人大常委会的数据库大多没有实现互联互通,没有实现共享。此外,立法相关资料库、立法过程的数据库、执法检查数据库都未建立。这不利于各级人大有效借鉴国外制度,参考学者研究,分享立法经验,发现和解决现有法律规范存在的问题。

  为了更好地发挥立法数据库对立法的支撑作用,需要建立国家统一的立法数据库。一是将各级人大常委会原有法律法规库的数据整合起来,建立权威的法律规范库,为审查立法草案是否符合上位法提供规范基础。二是建立立法过程信息库。通过连接各级人大常委会的网站和立法智能辅助平台来收集立法过程信息。在此基础上,分析在制定类似法律规范时,不同的人大及其常委会如何评估和反馈公众意见、如何处理不同利益之间的冲突以及设立条款的问题意识和考量因素,总结立法经验,形成立法过程大数据。三是建立立法资料库。立法资料库的数据主要包括学术文献和国内外相关立法。四是建立执法检查信息库。通过建立信息库与各级人大常委会网站的连接,收集执法检查相关信息。在此基础上,统计、比较、分析执法检查情况,完成法律法规实施效果评估报告,形成执法检查大数据,为法律法规的立改废提供支持。

  除了立法机关,行政机关、司法机关、检察机关等也掌握立法相关数据。不同部门拥有的数据流通性不足,尚未实现完全共享。这导致数据不全,出现数据孤岛,从碎片化的数据中难以完整地推导出事物的关联性,难以为立法决策提供强有力的支撑。因此,需要统一数据标准,建立共享开放平台,整合数据资源,实现不同部门之间数据的互联互通。

  有了海量数据,还得有能力“让数据说话”。此能力与大数据技术有关。近年来,大数据技术发展迅速,收集、存储、传输、管理和分析大数据的能力显著提升。但是,数据的增加非常迅速,现有技术仍难以对数量过于庞大的数据进行有效处理。而且,针对特定数据集和特定问题域已有不少专用解决方案,能否形成“通用”或“领域通用”的统一技术体系,仍有待未来的技术发展给出答案。[9]

  此外,要“让大数据说话”,立法机关还要善于从立法的角度提出问题,明确哪些问题需要大数据来分析。如果不清楚立法要解决的问题究竟是什么,就可能忙碌于收集大量的数据,却没法有效挖掘出有价值的数据,难以让数据发挥效用。只有弄清楚立法需求,才可能通过算法模型分析大数据,发现背后的规律,助力科学立法。

  四、立法运用大数据的限度

  运用大数据,立法机关能够更及时准确地把握实际情况,评估法律规范的实施效果,精准、科学地做出决策。但大数据对于立法的促进作用是有限度的。

  首先,立法是为未来设计规则、设计轨道。规则要依据立法事实来设定,立法事实则根据因果关系来确定。所以,因果关系是立法关注的重点。而大数据关注的是相关关系。维克托· 迈尔-舍恩伯格(Viktor Mayer-Schonberger)和肯尼思· 库克耶(Kenneth Cukier)认为,在大数据时代,新的分析工具和思路为我们提供了一系列新的视野和有用的预测。最重要的是,通过去探求“是什么”而不是“为什么”,相关关系帮助我们更好地了解了这个世界。知道“是什么”就已经足够,不必非要弄清楚“为什么”。[10]美国《连线》杂志主编克里斯·安德森(Chris Anderson)甚至以《理论的终结》为题发表论文,主张有了足够的数据,数字可以自己说话,相关关系将取代因果关系。[11]因果关系是两事物之间引起和被引起的关系。相关关系是事物之间非确定的相互依存关系。相关关系的核心是量化两个数据值之间的数理关系。[12]所以,有相关关系并不意味着存在因果关系。[13]由于关注点不同,大数据并不能发现所有立法事实。

  其次,立法的要旨在于衡量利益、调整利益。立法者需要在冲突的利益之间进行选择,明确应当优先保护何种利益。这是一种价值判断,不能由数据代而为之。

  最后,大数据的收集和分析要通过算法来完成。算法由特定的人决定。一旦涉及人,算法难以做到完全中立,难以完全避免偏见。因此,仅仅依据大数据分析的结论做出的立法决策,未必符合社会公平正义,符合大多数人的价值判断。

  基于此,在立法中“让数据说话”“让数据决策”是有一定范围的。在充分运用大数据提高立法质量和效率的同时,需要明确其限度。大数据是立法的辅助者,终究不是决策者。

[参考文献]

[1][3]国际科技数据委员会(CODATA)中国全国委员会编著. 大数据时代的科研活动[C].北京:科学出版社,2014:3.

[2]梅夏英.数据的法律属性及其民法定位[J].中国社会科学,2016(9);戴昕.数据隐私问题的维度扩展与议题转换:法律经济学视角[J].交大法学,2019(1);陈兵.大数据的竞争法属性及其规制意义[J].法学,2018(8);汤应.大数据安全与隐私保护[J].现代工业经济和信息化,2018(7);李安.人工智能时代数据竞争行为的法律边界[J].科技与法律,2019(1);吴伟光,大数据技术下个人数据信息私权保护论批判[J].政治与法律,2016(7).

[4] M. Wessler. Big Data Anylitics[M]. New Jersey: John Wiley & Sons, Inc.,2013:6.

[5][9]梅宏.十三届全国人大常委会专题讲座第十四讲:大数据:发展现状与未来趋势[EB/OL].http://www.npc.gov.cn/npc/c30834/201910/653fc6300310412f841c90972528be67.shtml,2020-01-03.

[6]Tony Hey, Stewart Tansley, Kristin Tolle. The Fourth Paradigm: Data-Intensive Science Discovery[J]. Proceedings of The IEEE, 2011(99).

[7]黄欣荣.大数据对科学认识论的发展[J].自然辩证法研究,2014(9).

[8]杨维汉、陈菲.改革开放40年,地方立法之“变”[EB/OL].http://www.xinhuanet.com/legal/2018-09/28/c_1123497868.htm, 2019-12-06.

[10][12][英]维克托·迈尔-舍恩伯格,肯尼斯·库克耶.大数据时代——生活、工作与思维的大变革[M].盛杨燕,周涛译.杭州:浙江人民出版社,2013:83,71,260.

[11]Chris Anderson. The End of Theory: The Data Deluge Makes the Scientific Method Obsolete[J]. Wired, 2008(6).

[13]Robert R. Pagano. Understanding Statistics in the Behavioral Sciences (10th ed) [M]. Wadsworth: Cengage Learning, 2013:144.

责任编辑:王 静

--------------------------------------------------

[基金项目]2019年度国家社科基金重大研究专项“以社会主义核心价值观为指导,推进国家治理法治化研究”(19YHJ006)。

[作者简介]周婧,中共中央党校(国家行政学院)政治和法律教研部副教授。