999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

論數字司法中價值的數據化及其挑戰應對

2025-09-10 00:00:00彭中禮
行政法學研究 2025年5期

目次

一、算法可以進行價值判斷

二、價值數據化的可能性及其方式

三、價值數據化的挑戰及其應對策略

四、結語

2023 年2月,中共中央、國務院印發的《數字中國建設整體布局規劃》提出,“建設數字中國是數字時代推進中國式現代化的重要引擎,是構筑國家競爭新優勢的有力支撐”。在數字時代,大數據、人工智能(AI)等數字技術在法律中使用被認為是不可避免的,因為他們被視為是網絡社會和所謂的“第四次工業革命”轉型的結果。①隨著技術不斷改變人類社會的工作和運作方式,有人預測人類活動的許多方面將被新技術改變甚至取代,人類的許多活動也會隨著時間的推移而發生變化。在技術迅速變革的背景下,人類社會以前基本上未受干擾的一些活動領域也受到了更廣泛的影響。譬如技術已經在深刻改變法律實踐,其可以通過取代、支持或補充司法角色來重塑審判過程。①可見,現代數字技術的飛速發展,對司法產生了重要影響。“不同于傳統的法院信息化建設、智慧法院建設,數字司法建設是法院工作從根本上實現高質量發展、邁人現代化的方法路徑。”從時代發展來看,“建設數字司法,對內可以推動法院審判方式和管理方式的重塑性變革,對外則能提升訴訟服務和社會治理效能,實現人民法院整體性、系統化的數字變革”②。在數字時代,建設數字司法已經成為司法迎接新一輪科技革命的時代選擇。事實上,國外已經出現了與數字司法相關的案例,例如,2016年威斯康星州訴盧米斯案(Wisconsin v.Loomis),作為美國司法史上首例數字司法領域的判例,正式承認了人工智能參與量刑裁判的合理性與正當性。③因此,對數字司法及其相關內容進行研究已經迫在眉睫。

目前,有關數字司法的研究,主要有三種路徑:一是對數字司法的基礎理論進行研究;二是對如何建設數字司法進行研究;三是對數字司法建設與社會治理的關系進行研究。從現有研究來看,對數字法院、數字檢察等新型司法的宏觀形態進行了深入分析,揭示了未來司法的發展趨勢,但是對如何進行數字司法的建構,還缺乏精細研究。特別是其中涉及的諸多具體理論與實踐問題,需要深人展開。比如,無論是智慧法院建設還是數字司法建設,都需要對人工智能和大數據的應用做深入具體分析,其中最關鍵也最核心的就是數字司法能否進行價值判斷,以及如何進行價值判斷。因此,要對數字司法的本質屬性作重要分析,然后重點討論價值數據化的可能性,最后對價值數據化的路徑進行理性反思,從而為數字司法的建構奠定理論基礎。

一、算法可以進行價值判斷

價值是觀念認知的結合體。任何決策的形成,既有機制作為保障,也需要有價值作為重要參與內容。這是因為,決策是人的意志的體現,無論其是否符合客觀規律、是否科學,價值以及價值判斷都隱性或者顯性成為決策的構成內容。然而,在數字司法建設過程當中,算法能否蘊含價值是學術界爭議的話題。比如有學者認為,算法能夠通過處理簡單案件,或者通過其固有的程序性、公式化計算來優化訴訟程序,但是卻無法勝任復雜疑難案件的處理。所以,算法決策促進形式正義有余而實質正義不足。即使隨著科學技術的不斷發展或者迭代升級,算法決策的質量會更好。然而,其依然無法成為獨立裁判的法官。④這是在隱性表達算法難以包含價值判斷。國外也有學者明確表示,司法人工智能難以與價值兼容。如巴西學者Claudia Toledo 和 Daniel Pessoa 在介紹巴西司法人工智能系統時,特別提出,人工智能系統(缺乏)透明度,無法做出價值判斷。因此,我們必須對此進行審慎地思考,在數字司法運行過程當中,其核心邏輯要素算法到底能否包含或者進行價值判斷?

(一)價值判斷是算法的重要構成

算法是解決問題的過程、步驟或者方案,通過算法人們就可以直接輸入問題而得出一個結果。算法是解決問題或完成任務必須遵循的一組指令。算法是一組有限的規則,給出了解決特定類型問題的一系列操作。算法應用于許多不同的領域,包括科學、工程、計算、商業,當然也包括司法。①在數字技術中,算法的核心能力是高速處理數據和執行邏輯運算,即快速實現先做什么、再做什么、最后做什么的步驟而促使問題得以解決。無論是自然語言處理算法、知識圖譜算法,還是機器學習算法,本質上都是通過對已有知識進行程序化設定的結果,進而模擬和表達人類的思考形式。“雖然人工智能并不執行所有任務,但可以執行計算和速度,而且還可以根據價值觀、感覺、標準、重要觀點或觀點進行理解和反思。”②實際上,價值判斷作為指導算法設計和應用的重要因素,一直是算法的重要組成部分,但是算法本身并不能進行獨立自主價值判斷。從自由意志的角度來看,算法尚難以成為自由意志的主體,因而其本身并不具有自主思考的能力,也不可能具有道德認知。因此,在進行數字司法建設時,運用算法進行司法決策,也難以說數字司法系統本身具有自主進行價值判斷的能力。“司法決策不僅意味著數據知識,還意味著判斷,即對構成現實的行為、事實、利益進行價值判斷。評價某事物為好的(價值判斷)或應有的/正確的(義務判斷)必須是人類獨有的活動。”③但是,這并不妨礙價值判斷成為算法的重要構成要素。已經有較多學者越來越明確地主張人工智能可以處理價值問題,比如有學者說,人工智能和算法越來越能夠在認知復雜的任務中取代人類工作者,包括與正義相關的任務。④當然,從技術本身來看,人工智能處于不斷發展的狀態,未來時段人工智能能否像人類一樣“聰明”,屬于不確定話題。但是,從當前的技術進路來看,人工智能也能夠間接處理價值問題。

一方面,從形成過程來看,算法的設定受到算法工程師以及人類決策者們道德觀念的影響,因而不可避免地蘊含價值判斷。算法既是人類決策的結果,也表征了人類的決策選擇。實際上,人類的決策涉及諸多相關因素的處理和選擇。算法不能在損失其功能的情況下將其與諸多環境因素隔離,也不能將其簡化為數字計算機所使用的二進制邏輯。算法以形式化的二進制模擬了人類的決策過程,從而使得人類關于某些問題的思維模式程序化、固定化。模擬人類決策是一種字母數字結構,其中不可能通過生物系統實現模擬形式的處理——生物系統包含數十億甚至數萬億個參數,這些參數定義了大腦的當前狀態,算法的形式和符號系統無法處理甚至是無法完全理解大腦的運算過程。因此,算法不具備評價數據好壞、公平或不公平的能力。它的代碼只是通過將某些數據與(開發人員)理解為良好、積極、正確的特定結果模型相關聯來重現開發人員所做的評估。換言之,算法或許不會產生道德感,但是設計算法的工程師以及人類決策者們是有道德感的,因此算法工程師或者人類決策者或明或暗地將自己的倫理道德觀念蘊含在算法當中。“現代法律主體制度是建立在對人的哲學理解基礎上的。它強調人除了具有認知、判斷和選擇等能力以外,還具備道德、良心、良知、倫理等要素。”①無論是何種道德觀念,道德感是人的重要特性。通過人的道德觀念傳遞到算法當中去,既是使算法具有內在規制的基礎要求,也是算法能夠復制人類道德感的程序顯現。在算法代碼中,它可以重現道德觀念,但它不能自主地做出這些判斷。算法被編程為識別數據及其特征,然后根據它們的數學代碼對它們進行分類,標記這些數據,將它們“裝箱”到前綴模型替代方案中作為可能的結果。當算法工程師將自己的道德選擇和道德判斷融入到算法程序當中去,算法的價值判斷就開始了。總之,我們還沒有處于計算機控制的反烏托邦中,我們的命運也沒有由無可爭議的計算預先決定。但數字技術提供了透明度和賦權的機會,被正確設計的系統可能有助于克服偏見和成見。人類仍然是決策循環的重要組成部分,仍然存在較多機會來影響和管理計算機技術的發展,以確保道德和法律成為軟件開發人員和分析師課程的一部分,并進行必要的監管。②

另一方面,從運行結果來看,算法的運行結果也包含價值內容。人工智能能夠寫詩、寫文章,能夠作曲、繪畫,就說明人工智能并不缺乏價值。試想一下,詩歌、文章、作曲、繪畫當中難道沒有包含價值嗎?只不過,這種價值可能是算法締造者們價值的體現,而不是機器本身的價值。甚至可以說,算法也許并不能自己創造價值,但是算法工程師賦予算法特定的道德價值的時候,算法也就蘊含了道德判斷于其中。有學者認為,“人工智能算法使得機器能夠通過可讀的指令程序,根據網絡痕跡、位置信息、消費記錄等數據,對人的行為進行評價和預測。”③所以,應當說,當人工智能再現其開發者的價值判斷時,所呈現的任何有偏差的結果都不是程序固有的,也不是由程序生成的,而是源于/取決于所輸人的數據、數據的交叉組合以及參數權重的設定和它們之間的關系等因素。簡而言之,在這個以系統的方式自動復制已經建立的東西的過程中,人工智能唯一進行的活動就是人類偏見的強化和潛在化,以及社會偏見的指數級擴張,因為人工智能具有顯著的優越性。比如當使用帶有算法偏見的人工智能系統時,人類偏見的增強和強化與這些偏見的制度化、歧視性待遇的官方化,簡而言之,非法行為就會與合法化結合在一起。④還要看到,很多耦合因素也會導致算法價值因素的出現,其中最重要的就是算法異化現象。比如有學者就曾說:“隨著人工神經網絡技術的發展,人工智能在分析、預測和判斷上的某些能力已經超過了人類。有時還會出現算法超出設計預期的運算方式和輸出結果,令設計者難以理解的情況,即算法自主或者算法異化現象。”③在算法系統中,鑒于諸多因素耦合在算法程序當中,形成算法的多種疊加,也可能形成算法的價值因子。當然,這種現象過于偶然,不再贅述。還要再次強調的是,我們堅持算法可以進行價值判斷,并不是說算法可以自主地進行價值判斷,而是算法可以復制人類的價值,根據人類的思維進行相應的決策。

(二)算法進行價值判斷的方式和路徑

前文已證,算法蘊含價值判斷已經是不爭的事實。在數字司法中,價值判斷也可以成為司法的重要構成要件,從而形成數字時代司法的重要理想圖景。從程式上來看,司法裁判與機器學習算法具有相似性,即均為按照既定“算式”或者“公式”運行“計算”出特定結果,這個運行過程充分彰顯了過程理性或程序理性。人工智能司法裁判以法律語言的可計算和法律推理的能計算為前提,即法律語言通過形式邏輯的符號來表達,從而實現法律語言與計算語言的互譯,并基于此形成司法人工智能的計算推理程序。①從這個邏輯來說,無論是司法裁判,還是算法裁判,都需要運用法律語言,也需要有法律推理,二者的共通性使得數字司法具備了可能。換言之,司法具有可計算空間,這為數字司法的價值判斷奠定了技術基礎。從算法嵌人司法程序的一般理路來看,其進行價值判斷的方式和路徑主要有植入價值、進行價值對齊以及防范價值風險等。

第一,植人特定價值觀念。在司法活動中,價值問題是司法永恒的問題。某種意義上說,法官基于價值判斷的司法裁判,是許多司法案件成為經典案件的根本緣由。在具體案件中進行價值判斷,充分展現了人類法官的思維理路和驚濤駭浪般的價值權衡過程。有國外學者調查了公眾對算法法官的看法。結果表明,盡管法院用戶承認算法的一些優勢(即成本和速度),但他們更信任人類法官。相對于算法裁判,人們更信任人類法官做出的裁決。人們對算法法官和人類法官的信任程度取決于案件的性質:當法律案件涉及情感復雜性(相對于技術復雜或不復雜的案件)時,對算法法官的信任度特別低。②這是因為,人們覺得法官具有價值判斷的能力,而算法裁判卻是機器進行的裁判,缺乏價值判斷能力,也沒有道德情感活動。要讓人們足夠信任算法裁判,價值判斷內容必不可少。因此,既然算法不能夠自動產生價值,那么就必須給算法植入價值。價值植入是算法能夠獲得認同的前提和基礎,也是數字司法具有生命力的源泉。在數字司法建設的系列算法當中,司法價值觀念應當成為其核心內容。這是因為,人工智能與法律的邏輯之間不僅存在差異,而且存在對立,從而產生結構性的不相容。人工智能(基于數據)根據其參數對數據進行概括、分組,根據系統中編程的公式(標準化)將每個單獨的數據構建為預定的組件模型。這些概念與法律在司法判決中適用法律規范時所遵循的個體化和單一性概念恰恰相反。在司法判決中,一般和抽象的法律規范被具體化為具體案件的個體,其特定條件賦予了案件審理情況和主體的獨特性。因此,人工智能在司法判決中的使用恰恰忽略了具體案件獨特的事實和法律條件。③然而,多個獨特性概念的選擇,以及每個法律規則的選擇,本身就包含有何者優先適用的價值判斷。因此,在算法中植入司法價值,可以使得人工智能算法在選擇法律規則或者法律原則時,有特定的取舍,這種取舍就奠基于特定的價值觀念之上。特別是在算法黑箱、算法歧視等問題大量存在的背景下,要樹立人們對人工智能司法的信心,就必須將司法價值變成算法的支撐力量。具體而言,迎接人工智能算法引發的司法革命,促進數字司法的迅猛發展,就需要形塑司法算法的價值觀,確保數字司法發展既沿著遵循司法規律的方向,又能夠實現司法人工智能的未來前景。

第二,開啟算法價值對齊。價值對齊的概念由哲學家們最早提出,意欲追問在人工智能急速發展的大背景下,我們如何構建具有“與人類一致的價值觀”的自治系統。①這意味著,隨著人類社會科學技術的迅猛發展,人類逐步意識到價值觀的可貴,因而希望在技術發展的同時,人類價值觀不會被拋棄,人依然保持獨有的價值思考能力并傳遞到其他可能的新興主體之上。學者們對此的一般回答是:“人工智能體價值對齊就是人工智能技術符合人類價值觀,與人類價值觀保持一致。人工智能體價值對齊源于人類的有限理性,人工智能體的自主性、不確定性和風險性。”②科技哲學家們在價值對齊的內容和目標上進行了更為充分的界定,認為價值對齊應該實現機器目標和人類需求之間的協同,確保機器與人類指令、偏好、利益、價值等維度保持一致。③所以,推進價值對齊是人類解決人工智能挑戰困境的重要價值思路。算法工程師們在設計算法時,應當將人類的價值觀念融入到人工智能系統當中去,并且在可能的情形下,要積極推進人工智能自主推演的價值觀念與人類的價值觀念相一致。無論哪種方式,都表明人類對自身價值觀念的維護,甚至說是對于人類價值觀念可能喪失的擔憂。從廣義來看,“價值對齊源自人類期冀自身價值觀被技術理解并被實現,進而契合技術為人類帶來福祉的訴求,是通向技術社會化與社會技術化雙向奔赴的一種嘗試”④。從司法的角度來看,司法裁判更需要有價值觀念的參與,這是實質主義司法觀的重要內容,也是司法實踐的常態。因此算法裁判需要植入價值觀念,使得司法算法價值與人類價值相一致,從而形成數字司法的價值對齊。在現有的技術實踐中,人工智能通過數據庫訓練(學習),可以根據數據庫中發現的模式為相似的輸入提供不同的解決方案。這意味著數據相似,數據背后的價值可能有不同,特別是不同的數據組合(結構化數據)更有不同的價值理念。這就對價值對齊提出了較高要求。從技術層面來看,確定價值對齊的技術性手段主要包括監督精調(Su-pervised Fine-tuning)、人類反饋強化學習(RLHF)、合作逆強化學習(CIRL)、憲法AI(Consti-tutional AI)和紅隊測試(Red Teaming)等。③以RLHF為例,我們可以對價值對齊的路徑進行更為細致的理解。RLHF的目的是強化人類偏好,以人類反饋和強化學習相結合,從而形成一個可以不斷調整和加強的算法路徑。在RLHF中,算法將人類的價值偏好(如公平、正義、平等等)設定為獎勵,以信號(符號)的形式設定。在進行模型訓練的時候,人類偏好的設置可以增強模型對人類意圖的更好理解,也能夠更好滿足人類需要。這樣使得模型和人類之間的交互不斷實現自由優化,從而使得輸出結果與人類的期望越來越相近。當然,其中如何來實現價值偏好的設計,是一個根本問題。可見,在數字司法過程中,價值對齊將會成為數字司法進行價值判斷的核心要素之一。

第三,防范算法價值風險。既有的算法規制理論在研究算法風險時,往往強調算法存在算法黑箱、算法歧視以及算法權力等三大風險。因此,如何識別算法領域的風險,是算法治理的基礎。學者們對此也提出了較多的風險防范技術,比如進行算法解釋等。其實,這三大風險本質上還是與價值判斷有關。換言之,之所以存在算法黑箱、算法歧視乃至算法權力等風險源,從價值層面來看就是司法價值并沒有在算法中得到有效貫徹和融入,因此需要以價值對齊為基本任務,防范算法的價值風險。比如,有新聞報道指出,隨著人工智能的發展,算法具有智能性,開始主動對用戶實施影響展開操縱行為。如Facebook的“情感蔓延”項目通過控制對50萬名用戶的新聞投放,用積極或消極的語言來表述新聞,來使用戶受其影響而自己發出積極或者消極的消息。這可以說明兩個問題:一是人工智能已經初步具備了價值判斷的意識,能夠有目的地進行操作(當然,還不能依此稱之為自主進行價值判斷);二是算法工程師可以通過算法程序進行價值取舍。或者說,目前人工智能算法對價值的控制和運用還是受到算法工程師的影響。從人工智能技術的發展來看,人工智能是一個不斷發展的概念,隨著時間的推移,技術進步意味著計算機程序和系統變得更有能力執行任務和功能,而機器變得更有能力,日常任務和功能曾經被認為是不可或缺的。越來越多地使用人工智能來執行復雜的功能可能包括在不久的將來可能出現的情感處理的發展。①所以,為防止司法算法出現與人類價值相悖的情形,就需要在算法中植入價值以及進行價值對齊,并通過算法程序進行風險防范。從具體實施方式來看,防范算法價值風險,最根本的是要對價值問題有數據化的理解。比如,要對價值進行一般化的理解,而不是進行具體化的理解。人們對價值內涵的理解存在較大差異,因而需要對具體價值的內容進行最一般化的概括和提煉,避免形成人言人殊的價值而導致價值之間存在悖論。此外,對于價值之間可能存在的沖突,也要預設好標準體系,避免價值沖突時的決策緊張。當然,無論是形成一般化的價值,還是通過價值標準處理好價值沖突,最根本的還是要讓價值具有“可讀性”,即能夠被算法程式理解,這才是算法處理價值問題的關鍵。

二、價值數據化的可能性及其方式

推進數字司法建設,助推智慧司法系統進行價值判斷,最重要的前提就是實現司法價值的數據化。換言之,既然數字司法建設依賴司法算法的價值化傾向,那么在數字司法建設的過程當中,不斷實現司法算法能夠進行價值判斷的基本目標,就需要對價值進行數據化,從而形成司法價值的數據庫,為數字司法建設奠定價值數據基礎。

(一)價值數據化的可能性

在數字時代,一切數據,無論結構化數據還是非結構化數據,都能夠為數字司法系統所運用。在人類技術史上,大數據是帶有顛覆性質的技術。其以數據技術為核心,將未經加工的原始事實、數字、符號或觀察結果,乃至人類所有行為,都整合進數據當中,進而從中呈現某些事物的特殊規律。②因此,讓司法所涉因素進入司法程序成為數據,就成為數字司法建設核心內容。

第一,可計算是人工智能的重要前提和基礎。在人類的思考當中,價值判斷是以思維權衡的方式進行。這個過程是價值的取舍與平衡,是各種因素綜合作用的結果。從機理上說,人類大腦的特有“思維”功能形成了價值判斷的可能性,從而保障各種場景下人類自身的權益。人類的思維屬于生物反應,是對外在刺激的自然而然的本能動作。然而,在人工智能系統當中,計算機的“思考”屬于物理反應,是人類對物理信號處理過程及其認識的體現,主要是通過進制語言進行。計算機對于事物的“理解”只能通過0和1這兩種二進制機器語言來實現,并基于此來識別指令并執行指令。所以,現階段的計算機尚不可能直接理解“塊結構”的證據。計算機在理解司法案件的證據時,必須將“塊結構”打散,形成可識別的結構化數據,進而讓計算機識別和計算。①計算機的本質是計算,算力是計算機的核心能力。因此,人工智能的前提就是算力。人工智能基于大數據、算力、算法等科技因素而實現,需要計算機科學和人工智能技術發展到特定階段才可能誕生。當然,無論是人工智能,還是計算機的算力水平,都是人類思考的結果。而法律價值,在信息化時代,不僅需要體現人類的情感和道德需要,也需要可計算,從而契合信息時代的發展趨勢。當今我們棲身于信息時代,這個時代正在重塑法律結構的綜合范式。如果信仰時代需要形式主義來統攝法律世界,那么信息時代則必須承認多元因素可能影響法律形態。對于法律秩序的建構而言,信息時代和信仰時代都有自己的圖騰。如果說信仰時代的圖騰是形式主義,信息時代的至高法則就嬗變為可計算實在論。可計算性標準的興起與動態規則的演進,終將成為這個時代對法律表達范式的歷史性貢獻。②當然,今天的計算能力尚不足以達到創建新秩序的地步,但是計算能力正在以指數級的能力增長,因此將一切事物進行可計算分析,將成為人工智能具有強大算力的基礎。可計算的承載形式是代碼。“代碼是網絡空間的架構,代碼片段是這種架構的基礎材料。我們在網上看到的一切都是通過代碼傳輸的,只有代碼才能使社會規則在網絡空間發揮規范作用。因此,代碼已成為網絡空間的規制工具。”③代碼是網絡世界的基本規則。法律可以調整人的行為,卻無法直接干預網絡世界的運行。法律規則要通過網絡成為智能要素,必須轉化成可計算的代碼,使得計算機能夠識別。所以,無論是法律規則,還是法律規則所蘊含的價值取向,要能夠成為計算機所識別的數據,就必須以可計算的方式轉化成代碼符號。

第二,海量數據是人工智能算力水平強大的必然需要。現在,人工智能越來越多地用于實現與人類相關的某些功能。雖然法律比任何游戲都復雜,但已有的許多成功嘗試表明人工智能法官能夠通過“閱讀”立法和判例法來學習如何應用法律,并且將這些法律原則應用于實際情況。鑒于非法律領域的發展和人工智能的快速擴張,未來十年內可能會開發出更復雜的法官人工智能。隨著機器學習與更復雜的預測分析過程相結合,更復雜的人工智能法官成為一種更可行的選擇。更復雜的人工智能法官的出現,其實需要更多的數據作為支撐。缺乏數據支撐的人工智能算力水平終究有限。當前,人們在設計法律人工智能時,其主要模式就是通過大數據實現深度學習,這種深度學習模式需要有龐大的法律數據庫(包括法律文書庫)。比如,將近一億份裁判文書的“中國裁判文書網”就是深度學習的主要數據來源。有了海量的裁判文書作為數據支撐,深度學習就有了重要前提和基礎。④以海量數據為基礎,司法人工智能的系統構造就有了可能,與此相關的法律制度就有了數據基礎,從而可以不斷提升算力水平。在數字經濟時代,算力是最先進的生產力,也是新質生產力在數字化時代的重要展現。在數字化時代,數據是新質生產力的新要素,算力是新型的生產力,算法則是新型科技。“數據、算力和算法的結合反映了新質生產力數字化發展的新水準。”①算力水平不斷發展的過程,就是對數據運用能力不斷提升的過程,也是數據不斷增大規模的過程。雖然說,數據規模巨大與否并不直接呈現算力水平,但是同質數據越多,整合的可能性越大,算力水平就會越強。因此,我們在建設數字司法過程中,最重要的一環就是為數字司法提供充足的司法大數據。司法大數據越多,司法所呈現的形態越多,計算機的司法算力就會越強大。“算力的支撐導致大智能。超大規模模型參數的算法即超多層的神經網絡,數據是超大規模的數據樣本,算力是超大規模的計算范疇。”②數據規模越大,算力越能支撐人工智能的發展。

第三,價值數據化可以通過經驗方式形成海量的價值數字。在司法人工智能的推進過程中,必然有一些反對聲音。其可能的論點是經驗知識難以運用數據化的方式來表達,比如個人成長過程中獲得的獨特感悟,這些感悟是未經歷者難以體驗的;此外,還有一些經驗知識往往是默示的或者隱性的,這些知識也難以用某些特定的語言來表達,從而導致司法所需要的經驗數據和事實當中存在的經驗數據難以匹配。對于這種觀點,筆者并不贊同。如果經驗不能夠被語言表達出來,則僅僅是個人的感悟和主觀感受。一旦個人感悟和主觀感受用語言表達出來,則數據化就成為可能。所以,能夠被數字化的經驗,首先一定是可以用語言表達出來的經驗。甚至還可以說,人們體現在司法判決當中或者其他法律文書當中的價值觀念和法律情感,等等,本質上也可以成為經驗。已有學者通過司法人工智能的實際運作指出,情感技術的發展表明,開發能夠識別人類情感并做出適當反應的技術是可行的,并且可能比人類更準確地做到這一點。③比如Aletras及其同事開發了一個程序,對歐洲人權法院有關侵犯人權的判決進行文本分析,以發現判決蘊含的裁判文書寫作模式。該程序學習了這些模式,并能夠對其他裁判文書的相關內容進行預測,其平均準確度為 79% 。這是機器學習的一個例子,其中計算機系統能夠“分析過去的數據以制定未來可推廣的規則”。可見,機器學習允許計算機程序通過經驗來模擬而不是學習復雜的任務來實現價值數據化。基于此,可以認為,在價值數據化的過程中,人們可以先對價值的形態及其表現進行標記實現特征提取,從而建立價值的數據庫。

(二)價值數據化的方式與路徑

要特別注意,“價值數據化”與通常所說的“數據價值化”在表述上有所不同,但兩者在核心思想上存在共通之處。數據價值化強調的是將數據資源轉化為經濟價值或社會價值的過程,而價值數據化則更側重于將原本難以量化的價值轉化為數據形式。在數字司法領域,這一過程不僅涉及數據資源的開發和利用,還包括對司法價值的深入理解和量化評估。在數字司法建設或者智慧法院建設過程中,其處理司法運行系統的最底層依據就是數據,無論是結構化數據或者非結構化數據,在其中都能夠起到特定的作用。在對價值進行數據化的過程中,我們可以借助于專家系統的某些有益經驗。“專家系統通常由知識庫、推理機和解釋界面組成。知識庫包含了專家系統的原材料;代表專業知識的規則和事實。推理引擎是一種計算機程序,它嘗試通過使用知識庫并與知識庫交互來解決用戶提出的查詢。”①因此,如果數字司法建設需要運用到價值數據可以形成價值數據的知識庫,那么價值數據化的可能性將大幅度提升。所以,推進價值數據化,可以通過對法律價值進行自然語言處理、提取向量特征、進行樣例學習等方式進行數據化運作。

第一,對法律價值進行自然語言處理。“自然語言是‘活著的’語言,具有柔軟性。因此,要讓‘頭腦僵硬’的計算機去理解自然語言,使用常規方法是無法辦到的。”②計算機能夠模仿人類大腦的運作,就需要能夠“閱讀”人類語言;計算機要能夠“閱讀”自然語言(人類語言),就需要進行轉化處理。計算機的運作方式是以通訊進行的,即“通過產生感知和信號而形成的有目的的信息交換,這些信號取自由約定信號組成的共享系統”③。人類語言通過特定方式轉化為機器語言——信息,就變成了人與機器信息傳遞的重要組成部分。“互聯網上已有超過萬億數量的信息網頁,而幾乎所有這些頁面都是用自然語言描述的。Agent想要獲取知識,就需要理解(至少部分理解),人們所使用的具有歧義的、雜亂的語言。”④所以,人工智能機器要具有進行價值判斷的能力,首先就需要有關于法律價值的知識,這就需要對法律價值進行自然語言處理,形成法律價值的知識數據庫。目前,在自然語言處理方面,以n元字符模型為代表的自然語言處理算法已經解決了很多種語言與機器語言的銜接問題。因此,將語言轉換成字符,就變成了最關鍵的一步。所有的法律價值都需要運用語言來表示,比如自由、正義、公正、秩序、平等或公平等詞語都可以有對應的語言符號,將這些表示特定價值的語言符號開發出來,就為形成自然語言的識別提供了可能。在自然語言處理的方法當中,人類較早運用的方法是創建近義詞集合數據庫。“通過對所有單詞創建近義詞集合,用圖表表示各個單詞的關系,可以定義單詞之間的關系。用這個單詞網絡,可以教會計算機單詞之間的相關性。也就是說,可以將單詞含義間接地教給計算機,然后利用這一知識,就能讓計算機做一些對我們有用的事情。”③比如,可能在近義詞數據庫中,法律價值“公平”“公正”“正義”“公平正義”“社會公正”等詞就會被當作同一類詞匯處理;而“自由”可能以“在法律的范圍內無拘無束/不受約束的活動”之類的描述替代。但是,隨著社會不斷發展,舊詞逐漸被人遺忘,新的詞語不斷涌現,會導致詞語數據庫需要不斷更新。為此,詞語數據庫將被語料庫(用于自然語言處理和應用的海量的文本數據集合)所替代。在這種方法的協助下,法律價值就可能被語料庫所收集并儲存起來使用。

第二,提取法律價值的特征向量。“大數據不再是單純的數字,而是能夠描繪出對象特征的數字集合。”③因此我們要將對象特征用數字符號的形式表達出來,或者說是將事物的原始數據轉化成有意義的表現形式的過程。具體而言,就是被定義的物體要能夠以被計算機所識別或定義的特性來體現(本質上,就是通過對被定義的單詞用其周邊的單詞進行描述)。在自然語言處理過程中,特征向量通常用于表示文本數據的數值特征,以便于機器學習算法進行后續的處理和分析。比如,我們要區分自由、正義、公正、秩序、平等等詞語,就必須用某種特定的符號把這些詞語表示出來。再如在用數字符號描述西瓜的時候,可以將西瓜的特征向量分解為外形、顏色、味道等符號,從而讓人工智能通過這些符號元素來判斷這個就是“西瓜”。同樣的道理,我們也可以對“自由”法律價值進行特征向量的分解,形成關于“自由”特征向量知識數據庫,使其容易被人工智能迅速識別。如我們可以將“自由”概念用諸如“身體——未被羈押”“依據——根據法律”“表達——未被強制要求”等特定向量來表征/表達(由于研究深度的關系,上述表達可能仍然只是對“自由”的特征向量的初步表現)。要在促進算法公平性方面取得有效進展,就需要清楚地了解如何定義、衡量和討論算法公平,并了解衡量公平的各種選項有何不同、在其中進行選擇時涉及的權衡,以及如何做出有關公平性的決策。①當然,比較明確的概念(如西瓜),確實可以用幾個特征向量來表征,但是一些非常抽象的價值詞匯,用特征向量來表達可能就比較困難,需要尋找更多的特征因素。一般來說,對某個特定的單詞所使用的上下文單詞(即與所要描述的事物有關聯性的單詞或者周邊的單詞)越多,即所關聯到的向量特征越多,對事物的定性分析就會越準確。所以,在建設有關價值的數據知識庫時,用什么特征向量來表示所有的法律價值,使各法律價值之間能夠相互區別,又能夠形成融貫性,已經成為學界應當討論的有意思的話題。

第三,進行機器學習。學習是一個不斷獲取信息以及進行能力改善的過程。如果人工智能能夠進行學習,那么人工智能的設計就能夠不斷改進以適合發展需要。“Agent任何部件的性能都可通過從數據中進行學習來改進。”②因此,隨著智能水平的不斷推進,機器學習能力就會不斷提升。機器學習就是從樣例(樣本)中進行學習,體現了數據的驅動力。“機器學習的研究主要分為兩類研究方向:第一類是傳統機器學習的研究,該類研究主要是研究學習機制,注重探索模擬人的學習機制;第二類是大數據環境下機器學習的研究,該類研究主要是研究如何有效利用信息,注重從巨量數據中獲取隱藏的、有效的、可理解的知識。”③任何系統,衡量其是否智能的標準之一就要看其是否具有學習能力。法律價值的數據庫/語料庫形成以后,既需要通過機器學習促使法律價值的表示方式不斷完善,也需要通過機器學習對法律價值數據庫中的知識進行有效挖掘,充分有效利用信息,以獲得更多知識。機器學習算法主要是根據現有數據設計自己的預測模型,在數據中尋找可用于生成非常準確的預測的模式。④機器學習算法是根據程序員選擇的數據集進行訓練的。通過這些訓練數據,他們可以識別并利用統計數據中的模式、關聯和相關性。例如,可以通過輸入數千張不同馬和驢的圖片來訓練算法以區分馬和驢。5在此基礎上,對法律價值的數據庫/語料庫中進行不斷的知識訓練,不斷進行機器學習,將法律價值數據充分運用以發揮其最大效用。

三、價值數據化的挑戰及其應對策略

關于法律價值的問題,是司法中最關鍵也是最重要的問題。人類關于法律價值的討論歷來不絕如縷。這是因為人類既對法律價值充滿信心,又對法律價值的明確性存懷疑態度。這種態度愈是矛盾,說明法律價值的作用愈是突出。所以,在數字司法建設過程中,如何對司法裁判中的價值判斷問題進行技術化處理,是其中的關鍵。上文雖然回答了價值數據化的可能性,為數字司法建設處理價值問題奠定了基礎,但是也應當對其限度及其優化對策進行必要反思。

(一)價值數據化的挑戰

價值數據化在數字司法中具有廣闊的應用前景和可能性,但同時也面臨一些挑戰和風險,建設數字司法就必須正視這些潛在的問題,及時預防,未雨綢繆,以加速推進數字司法建設。

第一,價值自身的獨有特性帶來的挑戰。一是價值主觀性的挑戰。價值問題一方面帶有客觀性,比如滿足人類基本需要的價值就應當客觀;但是,另一方面,價值還具有主觀性。不同的主體,其生活經歷、所受教育、生活群體的道德觀念影響等因素都會影響其價值觀。此外,個體之間對價值的認識也有較大差別。個體之間基于主觀偏好而形成的價值觀差異,也是十分普遍的事情。即使是學者們在研究所謂的公平、正義、平等、自由等具體價值的時候,差異也會很大。比如,對于何謂公平,有人會認為結果平等就是公平,有人則認為機會平等才是公平。二是價值量化標準的挑戰。在傳統觀念當中,價值一直被認為是抽象性很強的事物,難以用具體的語言描述。因此,對于價值的主觀性,用數據來表達會有一定的難度。在進行價值數據化的時候,也必須考量價值量化的標準和設計具體指標這一難題。三是價值沖突的挑戰。鑒于主體之間的價值觀不同,實現路徑也千差萬別,因而在面對同一事物時,不同的主體基于不同的目的就會有不同的價值要求。比如,在國家經濟發展過程當中,到底是要公平還是要效率,就是一個難題。這種沖突如果要確立量化指標,也存在確立標準困難的問題。從某種意義上說,人類確立了多元的價值標準,就會存在較多的價值沖突,從而形成價值沖突處理的難題。

第二,技術發展水平的限制。在價值數據化的過程中,最核心的要素是運用何種技術推進價值數據化。雖然說科學家們不斷發展了自然語言處理方法、特征向量的提取方法和機器學習的方法,但是在運用到價值數據化的過程當中,還需要有更多更為直接的發現和發明。換言之,當前技術在數據收集、處理、分析等方面存在較多局限性。比如,在數據的收集方面,存在一個成本過高的問題。即對價值進行數據化,必然需要對價值的表現形式進行充分研究,保證數據化的價值能夠獲得人們的認可,不至于形成算法黑箱,更不至于存在算法歧視。從國外的相關案例來看,算法技術的錯誤導致算法歧視的案例比比皆是。比如在一些學者的研究中介紹了美國著名的COM-PAS 系統中存在偏見現象,美國威斯康星州最高法院在州訴Loomis案中要求向部署者以及部署者用戶發出強制警告在刑事量刑中使用算法風險評估之前,由于許多私營公司參與了刑事調查報告(PIR)的編寫,因此,這種風險評分實踐中存在偏見或失敗的公平性指標的風險非常嚴重。①當然,也要看到,盡管人工智能在司法部門的應用可能會產生高昂的初始成本,并且根據所使用的工具而有所不同,但隨著時間的推移,這種實施不僅會在訴諸司法方面產生重要的積極影響,影響其發展和應對的效果,并且隨著時間的推移,所做的投資將得到回報。②

第三,數據質量的限制。人工智能的前提和基礎是數據,核心是數據質量。比如,司法數據的質量就影響人工智能大模型的發展。陳曉紅院士團隊通過研究認為,各級人民法院在錄入司法數據時,帶有一定的選擇性。而且,各個地方對于裁判標準的理解存在較大差異,導致大量裁判文書存在重要信息或者關鍵信息的缺漏。這些現象的存在,就會影響司法人工智能模型的應用效能。①如果說云計算為海量分布的數據提供了存儲、訪問的平臺,那么如何在這個平臺上實時挖掘數據價值,使其為個人、組織和國家服務,將是云計算必然的發展方向,更是大數據技術的關鍵核心議題。然而要想充分發揮大數據帶來的優勢,實現大數據的價值增值,高質量的數據是大數據發揮效能的前提和基礎,強大、高端的數據分析技術是大數據發揮效能的重要手段。在這樣的背景下,對大數據進行有效分析的前提是必須保證數據的質量。②在價值數據化過程中,數據的質量和準確性就會直接影響到價值數據化的效果,而且如何保證被數據化的價值與人們的普遍觀念相一致,避免算法歧視和算法偏見的形成,也是人工智能技術必須重點思考的問題。比如,對具體價值的特征向量的分析就應當全面且實事求是。人工智能能否進行價值判斷之所以存在巨大爭議,根本原因就在于價值本身是一個思想觀念的問題,而在目前的人類觀念中,人工智能是很難擁有自主意識,因而也就不可能自主進行價值判斷。本文所稱價值判斷,是在將法律價值數據化之后,促使人工智能適當復制人類觀念而進行的算法權衡。因此,要盡可能將人們所認識的法律價值以能夠被接受的形式復制到人工智能系統當中。換言之,此時算法工程師們所設計的價值數據化標準或者特征向量應當符合人類的理性、普遍認知。用與人類需要相一致的特征向量來描述法律價值,才是高質量的數據;否則,只會引起更為巨大的爭議。

第四,法律和倫理的可能限制。價值數據化問題本身就是一個法律問題,也是一個倫理問題。對價值進行數據化,既需要對價值本身的特征向量進行結構化分析,也需要基于海量數據來分析和論證特征向量的提取是否契合司法裁判的需要。當然,對特征向量的提取是一個技術問題,除了進行必要的驗證之外,本身應當不需要有太多法律制約。但是,在運用海量司法數據來進行分析和論證時,可能就會產生法律問題和倫理問題。從法律層面來看,對司法中與個人相關的敏感信息的收集、整理和分析必須嚴格遵守數據隱私法規,即算法工程師在設計價值判斷算法時,需要保持必要的透明度,也應當有必要的責任感,以此為基礎進行算法構造。從倫理層面來看,如何合理收集和使用個人隱私信息(這在司法中大量存在),既不至于侵犯公民的隱私,也不至于對社會構成潛在的危害,也是需要慎重考慮的問題。

(二)應對價值數據化挑戰的策略

司法裁判雖然處理的是事實問題和法律問題,但是不可能做到價值無涉。換言之,正是因為司法裁判中存在價值判斷問題,所以司法才會充滿人性化的魅力。價值數據化是數字司法領域的一個重要概念和實踐方向,是未來數字司法應當深人思考的問題。通過深人研究和探索,我們可以更好地理解和利用數據來推動司法工作的改進和創新。從上述可能限度來看,要繼續推進價值數據化,就應當不斷改進人工智能技術,提高數據質量,從而合理規避法律和倫理問題。

一是應對價值自身特性挑戰的制度路徑。推進價值數據化時,在充分利用大數據技術收集海量與價值相關數據基礎上,需要充分挖掘隱藏在數據背后的價值規律,特別是基于人類的活動體現出來的價值選擇規律。在此基礎上,建立價值的指標體系和評估制度就成為時代主題。一方面,要建立價值評估的指標體系。價值數據化,就要促進價值衡量指標的數據化確立。比如,針對特定領域的特定價值,可以基于特征向量建構評估標準。當然,在法律活動中,不同的法律價值應當由不同的特征向量來呈現,因而對法律價值進行評估,其所需要的指標體現也就會存在較大差異。另一方面,要建立價值分層分類評估制度,推進數據評估模型的建構。主體多元,價值多元,價值的評估也應當分層次分類型。要從法律層面提前規劃價值評估模型,為法律價值分層次分類型制度的建構提供技術支撐。

二是新型人工智能技術發展的法律對策。推進價值數據化,最重要的技術之一是深度推進大模型技術的研發。當前,以AI大語言模型(簡稱AI大模型)為代表的生成式人工智能(AIGC)技術飛速發展,并產生了巨大影響。但是從理論上說,AI大模型技術尚處于初級階段,遠沒有達到深入應用的水平。價值數據化是整個司法大數據應用最復雜的過程,也是司法人工智能能否實現的關鍵所在,可以預見,未來司法人工智能推進過程中,AI大模型必定是占主流的技術之一。因此,從法律層面來說,要運用立法手段促進AI大模型的深度發展和深度應用,保證技術應用的廣泛空間。此外,為了避免因數據孤島而限制了人工智能技術的應用,可以在立法確保數據安全與合法使用的基礎上,允許有關部門對相關數據進行整合,從而避免數據質量過于低下。

三是通過技術和制度提升數據質量。數據質量是價值數據化的保證,也是司法裁判能夠實現價值判斷的前提。因此要在技術層面和制度層面發力,保證數據質量不斷提升。從技術層面來看,大力發展數據采集技術和數據清洗技術,推進數據驗證和數據標準化。從現有的數據清洗流程來看,主要包括三個環節,分別是檢測并預處理數據源的數據格式、檢測預處理數據的完整性以及進行數據格式還原。①但是這個過程是非常繁雜的,因此應當需要與時俱進的創新清洗技術,特別是結合行業發展的特點來創新清洗技術,才能提高數據清洗能力,提升數據質量。從制度層面來看,要建立法定的司法數據清洗制度。換言之,對司法數據的清洗必須在法律制度的框架范圍內進行,對司法數據清洗的主體范圍、主要內容和應然進路進行具體規定。當然,也要設立必要的防范措施,避免個別人運用數據清洗制度弄虛作假,從而進一步影響司法數據的質量。

四是對法律和倫理問題進行合法性處理。展望數字司法在價值數據化方面的未來發展前景,以及對司法體系可能帶來的變革,要促進價值數據化的深人發展,對其中所涉及到的法律和倫理問題進行合法化處理就是重點議題。從法律層面來看,要將透明和負責任作為處理數據價值化問題的根本原則,建構數據化的指標體系。從倫理層面來看,要建構符合倫理規則的數據收集渠道,并在公開透明原則的指引下,合理合法運用司法數據,從而保護公民隱私。

四、結語

數字司法建設,本質上是算法的運行體制和機制建設。我們探討數字司法的算法邏輯、價值數據化的風險挑戰,以期為數字司法的實踐和發展提供有益的參考和借鑒。推進價值數據化,可以提升司法效率,并對司法公正進行評估,加強司法公信力建設。從本質上說計算機就是一臺符號的處理器,其通過0和1不斷地進行符號處理,進而表達人類的思想。在這個過程當中,符號控制了運算的邏輯,而邏輯則實現了結果的輸出。雖然這個過程看起來是機器操作的過程,但從根本上說,卻體現了人類思考的精妙性。至少從目前來看,計算機機器還無法擺脫人類的控制。將計算機機器運用到司法裁判過程當中去,不僅產生刑事方面的技術問題,自然也會產生價值與情感問題。因此,數字司法應當注重價值判斷,并對價值判斷的技術進路進行有效設計。應當認識到,這種與價值有關的討論越多,如何對價值進行評估的方法越多,各種方法之間的對話才能形成。從技術角度來看,衡量公平性的不同方法以及對“公平”含義的不同理解的存在,不可避免地意味著不存在完美的評估方法。然而,如果對可用于測量偏差的工具以及這些工具之間的關系有更多的認識,那么關于與公平有關的算法測算的對話將會更加有效,并且更有可能產生積極的結果。①基于此,我們需要有更多的學術討論來積聚智慧。此外,還要注意到,價值判斷所依賴的技術前提——價值數據化,本身是一個極具難度的課題,如何從多方向、多維度進行研究,也需要更深刻的思考。

Abstract: In the digital era, constructing digital justice has become a contemporary choice to embrace the newround of technological revolution.With artificial inteligence deeply involved in judicial decisionmaking,algorithms play a core role.The core ability of algorithms lies in their high-speed data processing and execution of logical operations. Algorithm design is influenced bythe ethnical concepts of algorithm engineers and human decision-makers.The results of algorithm operation also contain value content and thus inevitably involve value judgments.When algorithms are embedded in the judicial procedures,their general approach to value judgments involves implanting specific values,activating algorithmic value alignment, and prevent algorithmic value risks.In the process of digital justice,the most important prerequisite for value judgments is achieving the datafication of judicial values.The computability of artificial intelligence serves as the foundation for datafication,while massive datasets are essential for enhancing artificial intelligence's computational power. Moreover,value datafication can form massive value numbers through empirical methods.To promote value datafication,it requires natural language processng of legal values, extraction of vector features from legal values,and machine learning. While value datafication has broad application prospects in digital justice,it alsofaces challenges and risks.Fundamentally,digital justice necessitates algorithmic value judgments,and promoting value datafication is the key to enabling such judgments in digital justice.

Key Words: Digital Justice; Legal Values;Datafication of Values; Value Alignment; Data Cleaning

(責任編輯:張航)

主站蜘蛛池模板: 国产69精品久久久久孕妇大杂乱| 一级做a爰片久久毛片毛片| 2020国产精品视频| 91麻豆精品国产高清在线| 久久人午夜亚洲精品无码区| 国产在线专区| 国产精品欧美激情| 中文字幕在线观| 在线无码九区| 伊人色综合久久天天| 青青青亚洲精品国产| 91小视频在线播放| 亚洲精品无码久久毛片波多野吉| 欧美亚洲日韩不卡在线在线观看| 亚洲精品久综合蜜| 国产va免费精品观看| 波多野结衣一二三| 2021国产精品自拍| 91久久国产热精品免费| 91精品国产一区| 一级成人欧美一区在线观看| 亚洲专区一区二区在线观看| 色噜噜久久| 日韩欧美中文| 午夜视频www| 久久亚洲美女精品国产精品| 99久久免费精品特色大片| 国产电话自拍伊人| 国产黄色爱视频| 中文字幕在线观看日本| 国内丰满少妇猛烈精品播| 欧美一道本| 国产亚洲精| 狠狠干欧美| 亚洲a级毛片| 精品视频一区在线观看| 在线精品视频成人网| 精品国产福利在线| 欧美97色| 亚洲天堂2014| 亚洲第一在线播放| 亚洲国产精品日韩av专区| 亚洲无码日韩一区| 爱爱影院18禁免费| 久久精品这里只有国产中文精品| 在线观看欧美精品二区| 秋霞一区二区三区| 国产尤物视频网址导航| 一本二本三本不卡无码| 婷婷色一区二区三区| 欧美日韩中文字幕在线| a毛片在线| 国产剧情伊人| 精品国产污污免费网站| 国产性生大片免费观看性欧美| 免费看a级毛片| 欧美精品v欧洲精品| 欧美在线网| 国产chinese男男gay视频网| 国产精品美乳| 免费一级毛片| 男女男免费视频网站国产| 人妻无码AⅤ中文字| 国产屁屁影院| 一本视频精品中文字幕| 国产杨幂丝袜av在线播放| 欧美激情视频一区| 手机看片1024久久精品你懂的| 婷婷综合亚洲| 在线免费看黄的网站| 精品无码日韩国产不卡av | 日韩天堂网| 亚洲国产亚综合在线区| 国产第一页屁屁影院| 久久综合伊人77777| 啦啦啦网站在线观看a毛片| 亚洲水蜜桃久久综合网站| 伊人久久青草青青综合| 美女一区二区在线观看| 亚洲精品成人7777在线观看| 99精品免费欧美成人小视频| 国产门事件在线|