THE ALGORITHM SAYS YOU DID IT: THE USE OF BLACK BOX ALGORITHMS TO ANALYZE COMPLEX DNA EVIDENCE
作者:Katherine Kwong
刊載于:Harvard Journal of Law & Technology
刊載時(shí)間:Fall 2017
主要內(nèi)容:DNA可作為判定一個(gè)人有罪或無(wú)罪的可靠證據(jù)。但當(dāng)出現(xiàn)涉及多個(gè)人的DNA混合樣本時(shí),該分析結(jié)果很大程度會(huì)出現(xiàn)錯(cuò)誤。當(dāng)前用于分析和解釋復(fù)雜DNA樣本的常用技術(shù)并不可靠,甚至?xí)嬖诓划?dāng)起訴或定罪的可能性。為了提高對(duì)復(fù)雜DNA樣本分析結(jié)果的準(zhǔn)確性,許多公司與組織正在開(kāi)發(fā)一種算法系統(tǒng)來(lái)解釋DNA分析的結(jié)果,但仍然引起人們對(duì)算法的科學(xué)有效性及透明度的擔(dān)憂,無(wú)法確定由其得出結(jié)論的準(zhǔn)確性與可靠性。由此,本文建議法院應(yīng)嚴(yán)格審查分析DNA樣本的算法系統(tǒng)是否進(jìn)行科學(xué)驗(yàn)證、要求證據(jù)提交方提供算法的源代碼與分析過(guò)程以及禁止大家對(duì)算法系統(tǒng)的源代碼進(jìn)行二次公開(kāi)/披露或不當(dāng)公開(kāi)/披露等方式來(lái)建立一個(gè)更加公正的刑事司法系統(tǒng)。
一、背景介紹
刑事司法系統(tǒng)中對(duì)DNA證據(jù)的使用得到了人們的普遍認(rèn)可。通過(guò)當(dāng)前技術(shù)分析單一來(lái)源或簡(jiǎn)單的DNA樣本是可以直接得出結(jié)論的,但是分析一份含有多個(gè)未知身份的DNA樣本可能會(huì)出現(xiàn)問(wèn)題。這些DNA樣本被稱為復(fù)雜混合物,包括混合血跡和多人遺留的DNA物質(zhì)等。法醫(yī)一般采用主觀判斷和樣本處理技術(shù)相結(jié)合的方法來(lái)解釋對(duì)復(fù)雜DNA樣本的分析結(jié)果,但主觀判斷通常會(huì)帶入個(gè)人的偏見(jiàn)或認(rèn)知錯(cuò)誤,加之法醫(yī)缺少對(duì)案件細(xì)節(jié)的了解,由此對(duì)案件認(rèn)定可能會(huì)產(chǎn)生不利影響。
許多公司試圖開(kāi)發(fā)出一種算法來(lái)解決如何對(duì)DNA分析結(jié)果進(jìn)行主觀判斷的問(wèn)題。此類算法分析程序依賴一種“概率基因分型” 技術(shù),該技術(shù)會(huì)加快對(duì)復(fù)雜DNA樣本的分析速度并具有較高準(zhǔn)確率。當(dāng)前使用較多的是TrueAllele程序,該程序得出的結(jié)論可直接用于確定犯罪嫌疑人從而無(wú)需我們進(jìn)行主觀判斷,但該軟件提供的證據(jù)也面臨是否具有可靠性的爭(zhēng)論。因?yàn)門(mén)rueAllele程序并未公布其源代碼且法院也沒(méi)有強(qiáng)制要求其披露,所以我們無(wú)法獲知TrueAllele得出結(jié)論的過(guò)程,由此產(chǎn)生了對(duì)DNA證據(jù)真?zhèn)涡缘膽岩伞?/p>
二、使用算法分析DNA樣本的問(wèn)題
通過(guò)算法程序?qū)NA進(jìn)行分析存在著一些問(wèn)題,該方法的科學(xué)有效性并不明確,加之TrueAllele等拒絕公開(kāi)其代碼,由此法官和陪審團(tuán)只能依賴最終的結(jié)果進(jìn)行審判而無(wú)法得知結(jié)果做出的過(guò)程,也無(wú)法質(zhì)疑用于解釋結(jié)果的方法之優(yōu)劣。
不同的程序在有關(guān)如何解釋樣本數(shù)據(jù)的算法中有不同的選擇,分析一份完全相同的DNA樣本可能會(huì)產(chǎn)生不同的結(jié)果,在確認(rèn)樣本中存在多少個(gè)人的DNA時(shí)也可能會(huì)出現(xiàn)錯(cuò)誤。當(dāng)然,解釋復(fù)雜DNA樣本的算法也會(huì)存在一些代碼錯(cuò)誤,STRmix就公開(kāi)承認(rèn)其源代碼中存在錯(cuò)誤。TrueAllele的代碼也可能存在一些錯(cuò)誤,只是由于其拒絕將源代碼提供給任何第三方,因此并未被知悉。電子隱私信息中心(EPIC)指出,由于算法透明度的重要性以及對(duì)開(kāi)放政府和公平刑事司法系統(tǒng)的追求,我們應(yīng)該獲悉TrueAllele的源代碼。同時(shí),有學(xué)者認(rèn)為獲取代碼本身對(duì)于全面評(píng)估TrueAllele是至關(guān)重要的。正如法院不會(huì)接受未被證明具有專家資格的證人的意見(jiàn)一樣,法院也不應(yīng)該在未確定該技術(shù)是否有資格進(jìn)行分析的情況下就接受“數(shù)字專家”的結(jié)論。
鑒于不同的DNA圖譜在解釋的選擇上具有差異性,如果算法缺乏透明度就可能會(huì)導(dǎo)致執(zhí)法部門(mén)從不同的解釋程序中尋找一個(gè)對(duì)自己最有利的結(jié)果。有人認(rèn)為,當(dāng)前最大的問(wèn)題就是沒(méi)有對(duì)TrueAllele等程序進(jìn)行真正的獨(dú)立評(píng)估,對(duì)程序運(yùn)行的優(yōu)缺點(diǎn)是無(wú)從得知的。程序之中的差異性可能會(huì)導(dǎo)致執(zhí)法機(jī)關(guān)對(duì)不同的程序進(jìn)行測(cè)試直到他們獲得了支撐其案件的證據(jù)為止。由于這些問(wèn)題可能會(huì)對(duì)認(rèn)定犯罪嫌疑人產(chǎn)生潛在影響,甚至導(dǎo)致一些司法不公的事件,因此需要我們解決這些問(wèn)題。
三、討論與回應(yīng)
概率基因分型算法為司法系統(tǒng)的工作提供了很多便利,因此不能簡(jiǎn)單地禁止使用該技術(shù),我們需要解決的是該程序所面臨的缺乏科學(xué)有效性和透明度的問(wèn)題。NIST于2017年宣布對(duì)涉及DNA分析的法醫(yī)學(xué)技術(shù)進(jìn)行科學(xué)基礎(chǔ)審查,這便于我們確認(rèn)算法分析DNA樣本的可靠性。同時(shí),為保護(hù)憲法賦予被告人的辯護(hù)權(quán)以及維護(hù)正當(dāng)程序,我們應(yīng)要求公開(kāi)用來(lái)分析DNA樣本的算法代碼。
復(fù)雜混合型DNA樣本帶來(lái)的挑戰(zhàn)意味著刑事司法系統(tǒng)需要對(duì)這類法醫(yī)證據(jù)進(jìn)行更客觀的分析。概率基因分型算法最終可能為各種類型的DNA證據(jù)提供客觀、有效和可靠的結(jié)果。但就目前而言,由于分析DNA的算法缺乏經(jīng)過(guò)獨(dú)立驗(yàn)證的科學(xué)有效性證據(jù)及其代碼缺乏透明度,這導(dǎo)致概率基因分型算法得出的結(jié)論可能有誤。為解決這些問(wèn)題,法院應(yīng)嚴(yán)格審查某一特定算法系統(tǒng)是否得到了科學(xué)驗(yàn)證,還應(yīng)該考慮通過(guò)一項(xiàng)規(guī)則,即禁止將對(duì)復(fù)雜混合物進(jìn)行算法分析的結(jié)果作為案件的證據(jù),除非證據(jù)提交方向辯護(hù)團(tuán)隊(duì)披露算法的源代碼和分析過(guò)程。同時(shí),通過(guò)禁止二次公開(kāi)/披露或不當(dāng)公開(kāi)/披露代碼的規(guī)則來(lái)保護(hù)公司的商業(yè)秘密和財(cái)產(chǎn)權(quán),在維護(hù)司法公正的同時(shí)也保障公司的利益,以此建立一個(gè)更加公平公正的刑事司法系統(tǒng)。
