能否從數據中發現檢察辦案所需掌握的類案特點或規律,是判斷檢察大數據成效的真正標準
大數據檢察以類案為思維方式
? 全國檢察機關要以“類案”為切入點,打造數字式“類案監督”,作為以大數據賦能法律監督的核心任務。
? 相比于個案監督而言,類案監督是一種既無法割裂又有重大提升的高階狀態。檢察機關開展類案監督的技巧在于,針對辦案中發現的共性問題,實現促進該類問題一并解決的精準、高效監督,最終達致“辦理一案、監督一批、治理一片”的社會治理效能。
“以類案監督為核心”,是最高人民檢察院明確數字檢察創新發展的要義之一。具體而言,全國檢察機關要以“類案”為切入點,打造數字式“類案監督”,作為以大數據賦能法律監督的核心任務。“類案”是其中的關鍵詞,對于探索“大數據+檢察監督”(下稱“大數據檢察”)的重要價值不言而喻。
所謂“類案”,是“同案同判”法律原則中“同案”的近義詞。長期以來,人民群眾對于“同類案件、同樣判決”正義觀有著樸素的青睞。學術界作出了“類似案件、類似判決”“同樣案件、類似判決”“類似案件、同樣判決”“同樣情節、同樣處理”等理論表達。此等要求系立足個案角度,著眼于個案處理之間的連續性。而自從興起智慧科技擁抱司法的探索后,法律文書的要素相同、文本相似或條文同引等相關性的新式“類案”說出現,進而豐富發展了既有概念。相應地,基于類案的“類案檢索”“類案推送”“類案強制報告”等新事物層出不窮,基于類案處理而成的機器智慧就成為智慧檢務、智慧法院各場景的一項基礎工作。究其原因,含有類案元素的數據交由機器“學習”,方能形成不同于人類智慧的機器智慧。這就表明,類案不再僅作為衡量司法正義的標尺,更成為“法律+科技”創新中機器學習之源。
對于大數據檢察的探索而言,關于類案的現象與規律是不能忽略的,有關類案的原理也是可以嵌套并再造的。關鍵在于,如何從類案的視角理解大數據檢察的基本問題。
檢察大數據是什么?
簡而言之,檢察大數據指的是數據量達到一定級別的,可用于發現檢察辦案所需掌握類案特點或規律的各種電子材料。對紙面卷宗等傳統介質的材料進行掃描、光學字符識別、攝錄而出現的電子化材料,也在此列。當然,檢察大數據的數據量很難具體量化。從經驗層面來看,超越檢察官或辦案組的手工分析能力的數據量,均可算作檢察大數據。如一起刑事案件中被刻入光盤、硬盤的電子數據,就是檢察官手邊的數據寶藏。而從技術層面來看,數據量當然大一些、純一些為好,否則難以展現運用的優勢。
相比而言,能否從數據中發現檢察辦案所需掌握的類案特點或規律,是判斷檢察大數據成效的真正標準。這需要檢察人員在辦案中所使用的數據達到一個低限的量級。檢察大數據的低限在具體場景中并不高。筆者團隊曾經做過一些相關試驗,如利用多元線性回歸建模方法對破壞公用電信設施罪已決案例進行訓練,以生成量刑預測模型用于對異常量刑進行監督。當時發現,一旦用作訓練數據的裁判文書達到20000份,量刑預測模型的準確率就相對穩定了。在其他罪名的相關試驗中,我們也曾遇到訓練數據達不到20000份法律文書的情形。此種情況下,可以進行一定程度的補救,如對同一批訓練數據進行多次使用而起到數據擴增的作用。
滿足低限要求的檢察大數據可用于支撐數字檢察創新,奧妙在于通過求同法、求異法等進行類案特點或規律的提煉。如果分析獲得了不符合同類案件中正常規律的異常跡象,就可以作為法律監督的線索。完成這些任務,通常需要借助數據畫像、數據碰撞、數據挖掘等技術模型,下文將作進一步展開。
至于檢察大數據的具體樣態,司法領域常見的法律文書數據、法條適用數據、證據采信數據、執行類數據、民生領域數據、線索研判數據、資源保護數據、訴訟異常數據、非訴終結處理數據、行政非訴執行數據、網絡輿情數據、司法網拍數據、保險理賠數據、補(救)助資金監管數據、犯罪記錄封存數據、行業合規數據等等,均在檢察大數據之列,也支撐了當前檢察機關法律監督模型的開發。其實,法學研究領域中常用的學術論文、數字檔案館、會議綜述、專業網站等電子資源,也可以被用于數字式檢察監督實踐。筆者曾經調研了解到,某地檢察機關在查處一起醫療統方領域窩串案時,使用了期刊論文數據庫的作者檢索功能進行關聯分析,便捷地將涉案的醫務工作者同統方代表、醫藥代表區分開來。類似的還有使用國家專利檢索數據、企業工商信息查詢數據、組織機構代碼證查詢數據、裁判文書查詢數據等的情況。
檢察大數據的樣態并無限制,但是,對于檢察官是否能夠發現體現類案特點或規律的信息則確有要求。在當今大數據時代,檢察官群體缺乏的不是檢察大數據,而是一對洞悉大數據的科技透視鏡。左視鏡用于尋找基本夠量的專業數據或普通數據,右視鏡用以從數據中洞察到有關類案的信息。
大數據檢察如何推進?
大數據檢察的推進,要依靠科技創新與制度創新相互協調、交錯發力,共同形成一個整體運行架構。
在科技創新層面,檢察機關組織研發各種檢察大數據算法模型時,應聚焦類案監督。相比于個案監督而言,類案監督是一種既無法割裂又有重大提升的高階狀態。檢察機關開展類案監督的技巧在于,針對辦案中發現的共性問題,實現促進該類問題一并解決的精準、高效監督,最終達致“辦理一案、監督一批、治理一片”的社會治理效能。2022年3月,最高人民檢察院印發的第三十六批指導性案例中的檢例第146號是一個好示例。該案中,交管部門因相對人盧某醉酒無證駕車撞傷行人,作出吊銷其駕駛證的決定。盧某以其行為已被法院作出刑事判決、交管部門的行政處罰“系屬不當”為由,提起行政訴訟。二審法院判決交管部門敗訴。交管部門不服,申請檢察機關開展法律監督。檢察機關不是就案辦案,而是延伸辦案。通過分析司法大數據,檢察機關發現該案不是一起簡單的個案,而是反映出行政執法與司法裁判對法律的理解和適用存在認識分歧的類案。檢察機關以對該案提出抗訴為契機,加強與公安、法院等部門溝通,就辦理吊銷機動車駕駛證行政案件促進司法裁判尺度統一。這是對醉駕案件中交管執法不統一問題的一次性解決方案。該案的指導意義在于“解決執法司法辦案中認識不一致、標準不統一等共性問題,推動統一執法司法標準,正確執行法律”。
這種具有政策形成性的檢察監督案例,就是典型的類案監督。該案的成功在于檢察機關在行政檢察監督中使用了大數據,形成“個案線索特征發現—潛在共性要素研判—類案監督方案構建”的機制。該案辦理過程中,大數據初顯作為。從提升效率來看,該案的經驗是可以借助開發“檢察大數據—類案監督”的算法模型快速復制的。
“指向類案的數據碰撞模型”是當下著力最多的一大類工具。它指的是通過專門的計算機軟件對兩個以上的數據集進行碰撞比對,并對重合、交叉數據進行深度分析,進而識別可納入監督范圍的類案。仍以面向道路交通管理領域的大數據檢察為例,我國有的地方檢察機關將公安機關警綜平臺中關于醉駕的110接處警數據同提交酒精檢測機構的相關案件數據進行碰撞,或者將提交酒精檢測機構的醉駕案件數據同移送檢察院起訴的相關案件數據進行碰撞,或者將移送檢察院起訴的醉駕案件數據同移送法院審判的相關案件數據進行碰撞,一旦發現數據間比對結果異常,就可以啟動類案監督。
“指向類案的數據挖掘模型”是第二大類工具。它指的是從大數據中通過算法搜索其中隱藏的異常信息,進而識別可納入監督范圍的類案。以車輛保險詐騙類案為例,浙江省紹興市檢察機關曾以同一原告或者關聯原告多次提起交通事故賠償之訴為類案監督點,對當地相關案件的法律文書進行檢索。結果發現,有汽修廠多名員工名下交通事故責任糾紛案件異常高發,且呈現出相關案件訴訟代理人或者鑒定人單一的征象。之后,檢察機關通過對人員、社保、資金方面的信息流進行分析,挖出了一個騙取保險理賠款的“犯罪利益鏈”,后將該類線索移送公安機關立案偵查。若對該案中關于找到犯罪利益鏈的方法進行抽象建模,得出的就是一個形象的數據挖掘模型,且指向類案。
“指向類案的數據畫像模型”是第三大類工具。大數據的天然優勢在于可用于畫像。檢察機關對辦案群體、辦案環節、具體案件等均可以進行數據畫像。就任何類型案件而言,經由數據畫像后能夠形成一般的正態分布情況或規律。以此為衡量,若發現部分案件的辦理情況不符合正態分布的情況或規律,就需要轉由檢察官進行人工判斷是否存在傾向性苗頭問題,再決定是否用作類案監督的線索。當下,一些地方檢察機關圍繞虛假訴訟、民間借貸、交通事故賠償和婚姻財產分割等為重點領域開展類案監督,一個基本前提是基于此類案件出錯頻率較高的特點搭建了專門的數據畫像模型。
上述各種檢察大數據模型對類案異常點的識別,均是以機器自動判斷“類案”因素、人工判斷“類案線索”為特征的。這是兩項任務,也是兩個步驟,不可或缺。
目前,各種檢察大數據模型尚未達到真正智能化的程度。根據《中共中央關于加強新時代檢察機關法律監督工作的意見》指示的“運用大數據、區塊鏈等技術”的賦能方案,檢察機關還可以通過區塊鏈技術等強化這兩個步驟、兩項任務的融合,促使基于相關模型的類案監督平臺進一步走向智能合約式監督。簡單地說,檢察機關在開發的大數據法律監督平臺或軟件中可以預設各種自動執行的智能合約方案,既減少前期檢察官的參與壓力,也助推后期檢察機關同其他社會治理部門協同治理。
在制度創新層面,我國要啟動面向檢察機關類案監督的建章立制任務,積極化解已經或可能出現的各種重大法律障礙。舉例來說,大數據檢察往往帶有事前監督的色彩,這就昭示著行政檢察監督中引入大數據要警惕越界的問題。黨的十八屆四中全會通過的《中共中央關于全面推進依法治國若干重大問題的決定》指出:“檢察機關在履行職責中發現行政機關違法行使職權或者不行使職權的行為,應該督促其糾正。”這里明確限定了行政檢察監督啟動的前提條件。那么,檢察機關在大數據檢察中如何把握和執行“在履行職責中發現”之設定,做到于法有據、于情合理?這些都需要從國家層面的規章規則上予以明確。
但并不是說,大數據檢察只能墨守成規。當下力推“類案監督”是為了實現溯源治理,而兩者的重心不同:前者重在監督,后者重在治理;前者由檢察機關單獨實施,后者可以由檢察機關提出關于具有普遍性問題進行溯源治理的檢察建議,督促其他社會治理責任機關、社會自治協會等組織堵塞漏洞,在條件成熟時還由檢察機關參與協同發力;前者有不同程度的究責促改意思,后者鼓勵從源頭上化解潛在的風險……如此眾多的差異,就讓大數據檢察向溯源治理延展中具有更大的開拓空間。從這個意義上講,政法院校、法律學者也不是大數據檢察探索的旁觀者、局外人。
以類案為切入點,開展理念轉變、數據拓源、模型研發和制度跟進,全體檢察人要爭做大數據檢察的行動派。
作者系中國人民大學法學院教授、博士生導師刑事法律科學研究中心研究員