人工智能技术受到大数据、算法、算力等自身条件,尤其是数据完备性这一核心条件的限制。我国在法院信息化建设、司法公开工作方面取得了长足的进步,但以真正意义的大数据来审视,还存有不足。以裁判文书上网为例,在外在形式上存在公开不全面、选择性公开[23],中西部法院上网率不高[24],缺乏全国范围内、长历史跨度的裁判文书等问题[25]。在实体内容上,公开体量的巨大并不能弥补数据失真、维度单一等不足。少数裁判文书说理“简单粗暴”、表达模糊不清,其实已是本体意义上的“数据失真”了,而一些重要和关键的信息则“隐藏”在庭审笔录、合议笔录中,不能公开或不应公开。此外,司法过程的复杂性也决定了大量非电子化信息的存在,如大量手写的案件记录、副卷、实物证据、辩论信息难以电子化等。这些缺陷削弱了形成大数据的全样本基础。近年来出台的《最高人民法院关于加强和规范裁判文书释法说理的指导意见》(2018年6月)强化文书说理、公开法官会议纪要,部分法院尝试将合议庭少数意见写入裁判文书[26],这些实践做法既呼应了司法公正的需求,也为人工智能的司法应用提供了有力支撑。
准确地说,全样本问题更多地属于“困难”范畴,通过上述条件的创造和持续的努力,至少能够在理论上解决。但更要害的“极限”问题是,裁判文书的背后是诉讼活动,从信息论角度看,这种活动是动态的、博弈的,有着不断输入输出的信息流,至于如何把控信息流的“开关”,则取决于法官对诉讼活动的感知、理解和判断。具体地说,法官居间裁判,而控辩双方则不断地搜集证据、举证质证,罗列和阐释法律上的根据,试图说服法官并作出对自己有利的裁判。随着控、辩、裁各方的不断博弈,越来越多与案件相关的信息将不断汇聚。从理论上看,这将越来越逼近“案件真相”,也完全符合利用信息的认识论原理——利用更大量、更丰富的信息来消除信息的不对称性。但问题在于,控辩双方很可能基于自身的立场、利益整合出两套逻辑自洽的论证体系,并选择性地提供信息、隐匿相关案件信息或增加若干干扰信息,且随着审判进程的发展,各种不同价值或不同干扰度的信息都会继续“膨胀”。基于此,如何对不断输入的信息进行有效判断,并在恰当的时点“关闭”信息的继续“流入”成了裁判的关键所在。人工智能对此无能为力,因为其仅适用于信息相对确定、封闭、静态的领域。以围棋为例,从表面上看,棋手间的对弈似乎也是动态博弈的,实则处于封闭、静态的边界内。围棋的规则是完全确定的(不会受到新信息流的干扰),棋盘布局也内在地划定了可能的落子范围及其相应的获胜概率(信息流虽大,却是完整和封闭的),人工智能完全可以据此计算出“最优落子可能”。但在诉讼活动中,诉、辩、裁各方对法律规则的前置理解、事实调查或陈述技艺的运用都会影响干扰信息的排除、新信息流的纳入,从而使司法场景的边界处于变动不居的状态。这颇有些“人工智能不能两次跨入同一条河流”的哲学意味,一旦存在干扰信息或新的信息,人工智能的既有决策便将失之毫厘、谬之千里。[27]换言之,我们不可犯类推思维的错误,简单地将人工智能在围棋领域的应用复制到司法场景中,对司法场景变化、确定的掌控只能仰仗于法官的智慧和经验。这种掌控表面看来是对信息输入输出的分析和判断,实则是对人性、具体社会关系、生活经验的体察和把握,作为机器的人工智能无法以人的方式理解人,其应用也应止步于此。(www.xing528.com)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。