【趋势】法律大数据的时代来了吗?
2014-03-15 07:40 大数据 法律

大数据正使法律变得前所未有的强大,在当今数字时代,大数据极其重要,尤其对律师事务所而言,法律业务也许最终会靠数据驱动,那时我们可以通过一名律师从成千上万潜在相关的案件中筛选数据的能力,判断他或她是否是一名好的律师。 随着海量数据的获得,分析正变得更加重要。对法律信息进行验证、组织甚至使法律信息可视化的新工具正在帮助法律工作者掌握海量法院信息,由于存储变得更加便宜且处理器变得更加快速,这些工具中内置的智能很可能成为未来数字法律搜索的关键区别。本文整理者为天同CTO胡清平,i黑马分享本文希望对大家有所帮助。

大数据正使法律变得前所未有的强大,在当今数字时代,大数据极其重要,尤其对律师事务所而言,法律业务也许最终会靠数据驱动,那时我们可以通过一名律师从成千上万潜在相关的案件中筛选数据的能力,判断他或她是否是一名好的律师。

随着海量数据的获得,分析正变得更加重要。对法律信息进行验证、组织甚至使法律信息可视化的新工具正在帮助法律工作者掌握海量法院信息,由于存储变得更加便宜且处理器变得更加快速,这些工具中内置的智能很可能成为未来数字法律搜索的关键区别。本文整理者为天同CTO胡清平,i黑马分享本文希望对大家有所帮助。

文章一:大数据时代律师行业的三大变革

作者:中关村在线

面对新技术,法律专业人士通常是最保守的人群之一,但大数据时代,律师和律师事务所要想脱颖而出,卓尔不群,尽快采用大数据技术是不二之选。

2008年金融危机以来,律师行业经历了长期的低潮,越来越多的企业客户无法负担高昂的律师费用,导致律所裁员不断,规模日渐萎缩。而那些行业领先的律所开始推崇“精益企业”,收费模式也从过去的固定费率调整为按需服务。

但是“精益律所”并非根本的解决方案,律师事务所还必须借助大数据大幅降低信息处理成本,提高数字竞争力。近日GigaOM专栏作者DerrickHarris撰文指出,律师事务所基于大数据进行流程优化时,需要重点考虑三个问题。

一、自动化造就“火眼金睛”

文档检索可能是大数据对法律工作影响最大的领域。律所通常存储海量的非结构化电子文档,包括电子邮件、Office文档、PDF文档等等,从数以TB计的数据中检索案件相关文档简直就是律师的噩梦,费时、费力而且准确性差。通过大数据智能分析软件,律所能够大大提高文档检索效率。例如大数据创业公司Recommind开发的大数据软件能通过机器学习算法进行“预测编码”,大大提高法律文档的检索效率。另外一家值得关注的企业—PureDiscovery的语义分析技术也能大幅提高文档检索效率。

值得注意的是Recommind还在不断开发新的产品Hypergraph(超级图谱),例如帮助律师发现人、话题、时间线、非结构化数据之间关联关系的功能(编者按:类似图谱分析)。在这个领域Recommind面对的竞争对手包括Zylab、EMC和IBM。

二、一切皆可数字化

案件诉讼中会产生大量文档,而这些文档“蕴藏”的数据对后来的案件辩护和审理则具有很高的参考价值。

大数据创业公司Lex Machina 的目标客户是知识产权律师,为他们提供决策支撑数据统计服务。 Lex machina将很多过去的较为模糊的定性数据都给量化了,例如“这位法官对被告很不利”、“这种索赔的案件通常都能赢”或“这位律师对此类技术的经验值最高”等。Lex Machina的数据分析的数据源主要来自公开的PACER(联邦法庭数据库),PACER的数据一直在那,但是LexMachina是第一家通过机器学习和自然语言处理等技术从中“淘宝”的公司。

值得注意的是,LexMachina的前身是一个非盈利项目—斯坦福知识产权法律结算中心,公司还招募到了斯坦福大学的机器学习和自然语言处理专家Andrew Ng和ChristopherManning。IEEE Spectrum上有一篇对LexMachina的报道非常精彩。

三、大数据应用的自助与创新

与其遥遥无期地坐等大数据厂商开发好用的律师工具,律师们需要自己动手,创造性地利用各种现成的大数据工具和数据源。例如律师可以使用类似ScraperWiki这样的工具分析证人的Twitter联系人网络和活动记录。

律师还可以使用类似etcML这样的免费工具(对应的付费服务如AlchemyAPI)分析各种文本,包括推文和电子邮件,来发现关键观念或进行倾向性判断。零用import.io这样的工具从网站抽取数据(例如房产价格历史数据),并制作成图表。

另外,律师还应当学习掌握目前比较流行的一些数据可视化工具。


文章二:机器人会偷走你的饭碗吗——律师篇

译者:丫丫丫

过去几年,法律行业见证了科技创新的飞速发展,这一切都得益于计算机转译和理解书面文件的能力的增长。现在许多律师事务所使用“电子取证”工具来从大量证据中搜寻感兴趣的事实和数字。事务所还拥有可以起草法律文件的软件程序,耗时仅为人类的几分之一。这种自动化技术将把法律服务带到广大群众中去。

设想一下你现在正面临一场诉讼。你新开的一家公司创造了一个十分受欢迎的小程序,而你的首要竞争对手“微小软”国际公司正对你提起专利侵权诉讼。如果“微小软”公司获胜,那么你将要赔偿数千万美元。

于是你向公司内部的律师咨询,他推荐你雇佣一位阔佬有限责任合伙公司的专利专家。第二天,一群阔佬公司的律师浩浩荡荡进入你的公司,把你的所有选项一一列出。与“微小软”公司官司的辩护费用不菲——这还没算给案子指派的律师的计时收费,你还需要雇佣专家证人和陪审团指定的专家,并支付他们的差旅费和诉讼费。总的算起来你需要约500万美元,但阔佬公司长老级别的资深合伙人钱袋先生向你保证说花这笔钱是值得的——他处理过很多这种案件,他一边说一边向你眨眼睛,他的直觉告诉他他会获胜。

你的另一个选择是和“微小软”公司庭外和解。你需要支付1000万美元许可费,这笔钱不算少,但对你公司来说还是拿得出的——然后你可以继续做你的生意。

你会怎么办?

做出一个抉择并不容易。在这个公司时代,法律业是少数几个主要依赖人类经验的地带之一。任何人在卷入一个标的额数百万美元的案件前都会问这么几个基本问题——我获胜的几率有多大?我的律师有多棒?我该和解吗?——这些问题都没有一个确定的回答。“法律界人士们都有一个文化传统。”密歇根州立大学法学院助理教授丹尼尔·卡茨(Daniel Katz)说道,他是致力于将经验主义和人工智能引入法律的先锋法学研究者之一。“人类有很多想当然的事情,人们倾向于认为法律知识只适用于人类,而数据、计算机和自动化设备则不适合于此。”

卡茨正在研究他的“量化法律预测”。在美国,每年都有成千上万起专利案件被记录在案。因而很有可能“微小软”公司起诉你的案子和一大堆其他案件有着相似之处。如果你能够仔细分析“微小软”公司诉讼请求中的关键特征,然后再瞧瞧这许许多多具有可比性的案件是如何进展的,那么会怎样?“律师们就可以这样对客户们说,‘我觉得你有这么点胜率——而这是计算机基于一万件类似案件推断出来的胜率。’”卡茨解释道。

如今没有一台机器能做到这点,但将来会有。在上一章,我仔细审视了一种正蚕食着新闻业的技术——计算机在运用语言上愈发娴熟,它们已经能完全靠自己写故事。而记者的活计简直是小菜一碟;如果你想从事一个十分依赖于语言的工作,那么财大气粗的法律界可是个好去处。

在过去的几年中,法律行业见证了科技创新的飞速发展,这一切都得益于计算机转译和理解书面文件的能力的增长。现在许多律师事务所使用“电子取证”工具来从大量证据中搜寻感兴趣的事实和数字。事务所还拥有可以起草法律文件的软件程序,耗时仅为人类的几分之一。一些马上就要诞生的服务将能做更多的事——比如说商议合同条款,或者判断你是否该起诉。

这种自动化技术将把法律服务带到广大群众中去。许多本应该雇用一名辩护律师来处理商务事宜或个人纠纷的人却承担不起这笔费用。当你想和你的抵押放贷者作斗争、为创办一家小公司而起草合同或想要靠打官司赢得孩子的抚养费时,就可以依靠计算机软件。

虽然法律自动化对那些付不起钱请律师的人来说是一个福利,但这对于律师来说是个坏消息。律师行业现在本来就不景气,上法学院也不再是通向富翁之路的康庄大道。因为软件的存在使得更少的律师能做更多的工作,那么对律师的价格和需求必然随之下降。

“在我住的伊利诺斯州,你可以看到大片的闲置土地——因为你不再需要像以前那样雇人力耕种玉米和大豆。”伊利诺斯大学法学院教授拉里·利博斯坦(Larry Ribstein)说道,他写了好几篇关于法律界信息科技革命的论文。“我现在看到这片大豆田,就会联想到律师。”

在我所写的关于机器人和医生的文章中,我主张初级护理医师这个职业可能在机器人入侵中幸存下来,因为他们的职业靠的是必不可少的人类技能,例如引导面对面的谈话之类的能力。乍一看,法律行业看上去与之相似:法律由人类政客制定,由人类当局施行。当发生争论时,由人类法官和陪审团来裁决。法律世界的方方面面——从牵涉到合同和诉讼的专业语言,到复杂的分析推论,还有对法庭书记员和法官们烂熟于心的判例的信赖——都来自于我们称之为“律师”的那些怪物的前额叶。

如果你去看看大多数律师每天干的那些活,你会发现其中有许多部分都可以由机器来做。语言、复杂逻辑的处理,对涉及多变量情形的预测——计算机在这些事上可拿手多了。

想想法律工作中最死板的那部分:起草商业合同。在一名律师的职业生涯中,他也许要起草数以千计份合同,其中的许多都包含着大量重复的内容。现在,几家法律科技公司写出了可以自动生成这些文档的程序。这些软件的工作原理很像TurboTax报税软件,问你一系列的问题,之后运用分支逻辑深入到特定领域。马特·凯斯纳(Matt Kesner)是硅谷一家具有开创性意义的法律事务所——芬维克-韦斯特(Fenwick & West)事务所的首席信息官,他告诉我文档生成程序帮客户节省了时间和金钱。去年,该律师事务所研发了一套可以自动产生合并案所需文档的系统。“它将我们以前平均要花20到40小时计费时间的工作减少到了几小时,”凯斯纳说道,“就算那些需要很多文档的案子,我们也能把起草档案的时间从几天乃至几周缩减到几小时。”

电子取证软件的意义也是革命性的。这些系统可以挖掘数量巨大的材料(例如一桩民事诉讼中的所有电子邮件往来),从中找出哪怕是一丁点的证据。最简单的软件只是搜索特定的关键词,但是更复杂的系统可以检测那些律师也许会感兴趣的地方。曾经新手律师头一年做副手时整天都在干这活;现在计算机做得更快,成本更低,却和人类做得一样好。

现在,人类律师有一样优势:法律界对自动化一直抱有怀疑,而且它在某些方面完全不适用。为了建立他的法律预测系统,丹尼尔·卡茨需要大量的法律文件。但是这样的数据库并不容易得到。法庭会发布书面判决,但是其它资料——比如立案书和动议——都保存在诸如联邦法院的法院电子记录公众访问系统(PACER)这样的数据库中,想要浏览就得交费。直到这些信息更容易获取之前,人类律师还能再分杯羹。

但就像规定和条例不会永远保护人类药剂师一样,律师在今天这些尚有瑕疵的数据库和软件的压力之下也不应感到有多么安全。卡茨和其它研究者正在研究提取和解读历史资料的方法——他们建立了一个名为RECAP的项目,其目标是建成一个PACER的免费镜像。在法律的某些特定领域,数据分析已经广泛应用。2008年,斯坦福大学的一组律师和技术人员建立了知识产权诉讼信息交换中心(Intellectual Property Litigation Clearinghouse),一项追踪了10万多件专利与商标诉讼案的项目。斯坦福大学去年将它分拆开来,建立了独立公司“法律机器”(Lex Machina),该数据库是目前为止对专利权案件最全面的汇总,并且已经帮助推翻了一些专利法领域的基本信条。多年来,专利法律师们相信加利福尼亚州北部地区的法院更倾向于被告,而德克萨斯州东部地区则更偏爱原告,这种想法让他们习惯了挑选对自己有利的法院进行审理。“但是当我们查阅加州北部法院记录时,发现原告获胜的时候更多——完全和我们已知的常识相反,”法律机器的CEO约书亚·沃克(JoshuaWalker)说道。

像这样的故事——数据分析显示出人类直觉错误的例子——表现出了计算机分析的威力。“法律机器”项目尚不成熟,现在还没人用数据库来预测某个特定的专利案的结果。但你仍可以看出这样一套系统在你和微小软的诉讼中会制造多大的便利。至少,你可以用它来挑选你的律师,并决定是否和解。

沃克认为像“法律机器”这样的事物是设计来补充人类的智慧,而不是取代人类的。他说,随着人手越来越多,这个数据库会让律师对自己的工作更在行。这可能是真的,但是,同样毋庸置疑的是,这些系统可以系统地帮助客户决定该不该起诉,以及请哪家法律机构,还有在哪提交案件,这将减少律师的用途。我交谈过的所有法律研究者都没反对过这点,但有些人说从长远看来,自动化可以让当律师更有趣。大部分计算机能做的事都是律师痛恨做的。就像丹尼尔·卡茨所见,律师们可以将这个职业中最糟的那部分外包给机器,这样他们就可以用更多的时间来处理客户关系,并且确保计算机干了该干的活。

“你得让这条虚拟的流水线动起来——你就是挥舞着指挥棒的指挥大师,指挥着整个流程运转,”卡茨说。自动化不仅可以让律师们摆脱苦差事,还可以让他们能为更多客户服务。还有,以前你只能为几个花了大价钱的客户服务,而现在你可以通过机器服务成千上万的人,帮助那些现在无法获得法律服务的人。

如果自动化能花更少的钱,给更多的人带来法律服务,同时还能精减人类律师队伍,我觉得大多数读者都会认为这是一个多赢的选择。而从长远来看,这很可能实现。问题在于,这一步可能十分艰难——多家事务所会倒闭,一大群菜鸟律师会找不到工作,一个庞大产业的经济前景就此衰败。

但是,就我现在写到的所有职业而言,法律业的前景看上去其实是相对最光明的。的确,律师们会吃点苦头,但是我们剩下这些人会从中获益。“法律的存在并不是为律师提供饭碗的,”卡茨说道,“这不是它的社会功能。它的存在是为人们解决问题的——而如果我们可以用更少的律师服务更多的人,我不认为这是一条不合理的路。”

在接下来我要解释的是,我发现在科学界也有相似的趋势。也许不久以后计算机就会揭开一些自然界的基本奥秘。它们也许在逐步取代人类,我们是否应该小心这点呢?