法律论文 | 略论大数据对企业家刑事风险预防及辩护的功能

宋晓江 北京市京师律师事务所

崔利民 北京盈科(天津)律师事务所

近年来“大数据”的概念在全球范围内广泛传播,大数据的挖掘和应用在各行各业被实践。大数据给传统行业带来了空前的影响,信息技术的发展以及司法信息的公开化,使得大数据跟法律行业的结合成为可能。

大数据是指“用现有的一般技术难以管理的大量数据的集合”。维克托•迈尔-舍恩伯格在《大数据时代:生活、工作与思维的大变革》一书中提出大数据时代思维变革的三个特征:第一,思维所据以进行的不再是随机样本,而是全体数据;第二,不再追求精确性,允许混杂性;第三,思维依据的归属不再是因果关系,而是相关关系。

首先,我国法律大数据的研发和应用正处于尝试阶段。传统的法律数据库公司,并未对数据进行二次开发和挖掘,也没有专门针对需求从事数据挖掘和分析的企业。目前已经有一些新兴的互联网公司开始对现有的法律方面的信息进行采集、挖掘、分析,针对用户需求提供解决方案。

其次,我国的法律大数据在数据分析阶段存在一定的局限性。随着裁判文书的公开,以及互联网上其他法律信息的日渐积累,法律方面的大数据已经形成。笔者从一个专门从事法律大数据处理的公司了解到,截止到2015年10月26日,该公司通过裁判文书网抓取的裁判文书已高达918万份。但是面对海量数据的挖掘和分析仍然还存在一定的局限性。因为要实现数据分析就要对数据进行建模,而这个过程是需要法律专业的人士与建模人员进行配合才能实现有目的的分析。对海量法律数据的分析和应用是未来法律行业需要进一步探索的。

在过去没有大数据的时候,刑事法律的研究和实践主要依托于传统统计学上的抽样研究和分析,这种研究方式使刑事法律的研究和实践面临一定的困境。笔者将以企业家刑事风险预防及辩护为视角进行分析。

在过去,因为无法掌握到大数据,很多研究只能依托个别样本进行分析,或者是对抽样数据进行分析。这种分析研究方法存在很大的局限性,比如依托抽样数据无法得出某一个类型的企业家犯罪在全国范围内的分布情况;无法得出某一个具体的罪名下企业家的犯罪情形在数量上是如何分布的,从而进一步制定预防措施及对某个风险较大的犯罪情形进行进一步的研究分析;无法通过对数据的分析了解立法与法律实施过程中存在的差距;无法了解到某类案件在实践中的各方观点,比如法院的裁判规则等。

抽样调查的方式只能获得有限的信息,这种信息跟大数据信息相比是极其微小的,而后续的研究是建立在这种不完备、不充分的信息基础上的。这导致很多研究结果与大数据分析方法得出的结论相比是存在一定的片面性的。

因为搜集实践中的法律相关信息存在一定困难,传统的企业家刑事风险预防研究主要以学理研究为主,实践研究为辅的方式,对于实践阶段的研究主要停留在对典型案例的分析而非司法实践中的全部法律大数据进行分析,这导致很多研究结果与实践结合存在一定困难。

在实践中,律师很难有学习优秀经验的渠道,完全靠在实践中慢慢积累经验来提高自己的刑事辩护技能。这种经验主义的刑事辩护方式使得司法实践在刑事辩护这个环节存在很多的不确定性,也使得一些司法环境欠发达地区的企业家很难获得高效的刑事辩护法律服务,这对法律的有效实施是非常不利的。

目前,在法律服务领域,律师在对具体刑事案件的分析和处理时,往往是只能利用有限的资源,对案件背后的法理进行研究,而无法真正地从实践的角度进行分析和处理。但是由于立法和法律的实施之间是存在一定差异的,往往通过对法理的研究是无法掌握某一种刑事犯罪行为在实践中的法律实施情况的,这种差异往往会导致律师对案件的预判和结果产生比较大的误差,并且在辩护策略的制定上无法作出更有实务意义上的选择。

从裁判文书的逐渐公开,关于裁判文书的大数据也在逐渐形成。北京师范大学中国企业家犯罪预防中心编制的《2014中国企业家犯罪报告》的数据样本就是2013年12月1日至2014年11月30日期间,中国裁判文书网公布的刑事案件的一审判决书中按照设定的统计变量进行检索筛选确定的。而在这之前的《2013中国企业家犯罪报告》的数据样本则是对大众网络媒体公开报道的企业家犯罪进行持续检索和搜集形成的。相比之下,通过裁判文书网获得的数据样本不但比较全面,而且通过现有技术更容易获得,大数据的出现为企业家刑事风险预防研究提供了非常全面的样本。

由于样本的采集更加全面,更加科学,使得依据该样本得出的研究结论更趋近于客观现实。传统的抽样调查因为对样本采集的随机性很难把握,另外无法避免人为主观因素对抽样数据的选择,往往这种调查具有不稳定性,容易出现偏差。而依托于大数据的研究讲究通过全数据进行分析而非抽样,当数据到达一定的量以后便会自动减少个别特殊样本对整体结果的影响程度。很多人担心一些刑事案件的判决结果存在一定的主观不确定因素,比如法官的自由心证以及其他非法律原因的压力等。基于对裁判文书的研究往往会因为这些不确定因素而出现误差,而用大数据的研究方法,因为数据样本的数量庞大,就可以减少这种不确定因素对研究结果的影响,使结果更趋近于客观现实。

因为可以获得海量的数据,所以使很多在过去缺乏数据的情况下无法研究的内容,例如,通过对全部裁判文书的立案时间和裁判时间进行统计分析,就可以对研究对象的法院审理时间及效率进行分析。对于企业家刑事风险预防研究来说,《2014企业家犯罪报告》中就有包括犯罪企业家个人相关信息、所涉企业的情况、案发的地域分布情况、刑事犯罪罪名相关的情况等近40项指标,这在过去缺乏数据的情况下是很难进行研究的。

另外据笔者了解,现在已经有法律大数据公司自主研发相关系统,可以针对用户的研究需求,通过程序设定,运用机器对大数据进行处理,现代大数据处理技术的发展为未来相关研究提供了很大的便利。

通过对数据的研究分析,专业研究人员可以通过数据找到企业家刑事犯罪的特定规律及风险分布情况。通过对相关规律及风险点的分析,可以有针对性的提出预防的建议,为预防企业家刑事风险提供更可靠的依据和指引。

大数据的出现为刑事辩护律师的学习提供了非常好的便利条件。比如北京师范大学中国企业家刑事风险防控北京中心(以下简称“北京中心”),在大数据的背景下,由北京中心核心成员共同研究制定了关于企业家刑事辩护内部研究集。该研究集依托大数据的支撑,以罪名为划分标准,对罪名项下的一些重要内容进行了研究编写。其中,以罪名为划分标准的法律、法规、规范性文件汇编,以及通过对裁判文书数据的整理、分析而得出的各罪名项下的相关重要指标都是依托大数据的研究方法而制定的。该内部研究集不仅可以对企业家进行刑事风险预防起到法律意义上的借鉴作用;同时该研究集中的重要信息和知识,可以为刑事辩护律师在实践中的研究和辩护提供支持。

上文提到,因为缺乏对法律实施过程的分析,使得实践中企业家刑事辩护策略的制定主要依托对法理而非实践的研究。各类法律大数据信息的出现,使对法律实施过程的研究和分析成为了可能。比如,通过对大数据的宏观分析可以了解某类案件的裁判规则;通过对大数据的微观分析可以预估特定地域,甚至特定法官对于某一类案件在实践中的隐形的裁判规则。在美国2004年的一项研究中,研究者使用最高法院9名大法官以前审判过的628起案件的历史数据,对每位法官在特定案件中可能的投票结果进行了预测,结果该模型预测的法院同意审判或驳回上诉的结果正确率(75%)要高于普通法律专业人士(59.1%)。

不仅如此,通过对裁判文书中检方内容的深入研究分析,可以分析出某类案件检方一般采取的公诉方法和策略;通过对特定证据与裁判结果之间的关联分析,可以对某类证据与判决结果之间的关系进行预测。

综上,虽然大数据研究得出的结论并非因果关系,而是关联关系,但是通过对大数据进行研究得出的具有某种关联关系的结论对于企业家刑事风险预防及辩护都有很大的意义。随着大数据挖掘和分析技术的越来越成熟,未来大数据在刑事法律研究和实践中会起到越来越重要的作用,也必然会为刑事法律研究和实践带来更多新的思路和方法。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,839评论 6 482
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,543评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 153,116评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,371评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,384评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,111评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,416评论 3 400
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,053评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,558评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,007评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,117评论 1 334
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,756评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,324评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,315评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,539评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,578评论 2 355
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,877评论 2 345

推荐阅读更多精彩内容

  • 漫漫路,走千山,渡万水,景色璀璨,莫回眸 瑟瑟风,掠群峰,啸层浪,烟花亦冷,怯相逢 时光似酒酒相逝,宙宇类舀舀易空...
    范知一阅读 181评论 0 0
  • “我养你”,才是世界上最毒的情话 谎话往往比真话要悦耳动听。 来自夜听漫读 “我想离婚了” 看到柚子在屏幕上打出这...
    Ytyangtin阅读 507评论 0 2
  • 我们购物时到底是理性更多还是感性更多呢? 这几天河马陪姑姑买车,我们跑了很多家店我,最后在吉利和长安之间犹豫。本来...
    河马先森阅读 164评论 0 1
  • 晨起,寒风刺骨,雪珠纷飞。冬天,真真的到来了!冷,彻骨的寒冷,穿上了厚棉衣,奔往学校的方向。匆匆忙忙吃完早...
    A桃子李子阅读 694评论 0 0