數(shù)據(jù)爬取犯罪治理需處理好規(guī)范與價(jià)值、思路與方法、體系與問題等多對(duì)關(guān)系,以刑法懲治數(shù)據(jù)爬取犯罪僅為數(shù)據(jù)爬取犯罪治理中的一部分。筆者認(rèn)為,討論數(shù)據(jù)爬取其他治理路徑前,先要厘清兩方面內(nèi)容:一是數(shù)據(jù)爬取犯罪的刑事風(fēng)險(xiǎn)類型;二是數(shù)據(jù)爬取犯罪治理的法理基礎(chǔ)。
數(shù)據(jù)爬取犯罪的刑事風(fēng)險(xiǎn)類型
違反網(wǎng)站Robots協(xié)議等合約授權(quán)。網(wǎng)站Robots協(xié)議等合約授權(quán)一般會(huì)涉及允許數(shù)據(jù)爬取的性質(zhì)、內(nèi)容與范圍,也會(huì)明確禁止“爬取”的數(shù)據(jù)。如,許多企業(yè)會(huì)在平臺(tái)網(wǎng)站服務(wù)條款、使用說明或權(quán)責(zé)聲明中,將上述內(nèi)容加以列明,但未使用相應(yīng)技術(shù)措施,如設(shè)置網(wǎng)絡(luò)爬蟲身份識(shí)別與攔截機(jī)制。這種情況下,數(shù)據(jù)爬取者一旦違反Robots協(xié)議等合約授權(quán),就可能面臨相應(yīng)刑事風(fēng)險(xiǎn)。
植入惡意“爬蟲”程序或者腳本代碼使得存儲(chǔ)數(shù)據(jù)被不當(dāng)修改或增刪!芭老x”程序或腳本代碼的本質(zhì)是一種自動(dòng)化復(fù)刻工具。使用該工具必須遵守法律底線,如果使用惡意“爬蟲”程序或者腳本代碼,突破存儲(chǔ)數(shù)據(jù)技術(shù)防范措施并造成嚴(yán)重后果的,那么有可能面臨相應(yīng)刑事風(fēng)險(xiǎn)。
不當(dāng)使用網(wǎng)絡(luò)爬蟲技術(shù),未經(jīng)許可,故意避開或者破壞他人為其作品設(shè)置的技術(shù)措施!吨腥A人民共和國刑法修正案(十一)》實(shí)施后,無論是否通過信息網(wǎng)絡(luò)向公眾傳播作品,只要數(shù)據(jù)爬取者不當(dāng)使用網(wǎng)絡(luò)爬蟲技術(shù),未經(jīng)著作權(quán)人或者與著作權(quán)有關(guān)的權(quán)利人的許可,故意避開或者破壞為著作權(quán)(包含鄰接權(quán))專門設(shè)置的技術(shù)措施,都有可能成立侵犯著作權(quán)罪。
網(wǎng)絡(luò)爬蟲算法的設(shè)計(jì)缺陷使得批量獲取數(shù)據(jù)出現(xiàn)重復(fù)甚至無效的情形。比如,網(wǎng)絡(luò)爬蟲算法在測(cè)試階段的定位是自動(dòng)獲取真實(shí)的數(shù)據(jù)信息,但在實(shí)際運(yùn)行階段,由于受到不同因素干擾,其精準(zhǔn)度發(fā)生偏差,在算法研發(fā)者沒有及時(shí)作出調(diào)整時(shí),網(wǎng)絡(luò)爬蟲算法就會(huì)抓取許多不真實(shí)的數(shù)據(jù)信息。如此一來,爬取數(shù)據(jù)信息的數(shù)量與真實(shí)性會(huì)發(fā)生變化,會(huì)提高數(shù)據(jù)爬取者面臨的刑事風(fēng)險(xiǎn)。
數(shù)據(jù)爬取犯罪治理的四個(gè)維度
建構(gòu)數(shù)據(jù)爬取犯罪一體化治理體系。在發(fā)展數(shù)字經(jīng)濟(jì)背景下,需要科學(xué)建構(gòu)數(shù)據(jù)爬取犯罪一體化治理體系,努力形成法律法規(guī)、司法解釋、部門規(guī)章、規(guī)范性文件、政策文件、信息技術(shù)標(biāo)準(zhǔn)等規(guī)范體系。這些規(guī)范可以不同方式預(yù)防數(shù)據(jù)爬取犯罪的刑事風(fēng)險(xiǎn)。如《中華人民共和國網(wǎng)絡(luò)安全法》《中華人民共和國數(shù)據(jù)安全法》《中華人民共和國個(gè)人信息保護(hù)法》《中華人民共和國民法典》《中華人民共和國刑法》《中華人民共和國反不正當(dāng)競(jìng)爭法》等法律旨在確立禁止不當(dāng)數(shù)據(jù)爬取的總體要求、基本原則與部分細(xì)節(jié)內(nèi)容;《互聯(lián)網(wǎng)信息服務(wù)管理辦法》等明確了爬取特定內(nèi)容的信息的違法性;《網(wǎng)絡(luò)安全審查辦法》等部門規(guī)章規(guī)定了公開收集使用數(shù)據(jù)的規(guī)則,要求爬取數(shù)據(jù)必須符合公開收集使用數(shù)據(jù)的目的、規(guī)模、方式、范圍、類型、期限等。在未來規(guī)范完善中,還應(yīng)當(dāng)制定反網(wǎng)絡(luò)爬蟲的信息技術(shù)標(biāo)準(zhǔn),合理分配強(qiáng)制性信息技術(shù)標(biāo)準(zhǔn)與推薦性信息技術(shù)標(biāo)準(zhǔn),不斷凝聚國家標(biāo)準(zhǔn)與地方標(biāo)準(zhǔn)的優(yōu)勢(shì)力量,推動(dòng)建構(gòu)數(shù)據(jù)爬取犯罪一體化治理體系。
發(fā)揮網(wǎng)絡(luò)爬蟲行為準(zhǔn)則的治理效能。互聯(lián)網(wǎng)企業(yè)應(yīng)當(dāng)及時(shí)發(fā)布明確有效的Robots協(xié)議,告知數(shù)據(jù)爬取者哪些頁面或者數(shù)據(jù)可以爬取,哪些不可以爬取。此外,在Robots協(xié)議中還需要細(xì)化授權(quán)范圍,以及無權(quán)爬取或者超越授權(quán)爬取后,網(wǎng)站管理員發(fā)出通知的途徑與方法。這些內(nèi)容對(duì)法官把握數(shù)據(jù)爬取引發(fā)的刑事風(fēng)險(xiǎn)大小具有重要作用。針對(duì)不同場(chǎng)景下的數(shù)據(jù)爬取,各種Robots協(xié)議具有不同強(qiáng)度的約束性:針對(duì)部分網(wǎng)頁的小型數(shù)據(jù)爬取,Robots協(xié)議的約束強(qiáng)度往往較低;針對(duì)較多網(wǎng)站或者數(shù)據(jù)庫的中型數(shù)據(jù)爬取,當(dāng)涉及企業(yè)商業(yè)利益時(shí),Robots協(xié)議的約束強(qiáng)度通常較高;針對(duì)全網(wǎng)絡(luò)或者使用搜索引擎的大型數(shù)據(jù)爬取,Robots協(xié)議的約束強(qiáng)度往往最高。通過區(qū)分Robots協(xié)議約束強(qiáng)度的高低,有助于我們審視數(shù)據(jù)爬取者在未遵守Robots協(xié)議時(shí)的可罰性問題。
釋放數(shù)字市場(chǎng)運(yùn)行機(jī)制的治理效應(yīng)。數(shù)字市場(chǎng)運(yùn)行機(jī)制強(qiáng)調(diào)以自身運(yùn)行規(guī)律和相應(yīng)監(jiān)管舉措來防控?cái)?shù)據(jù)爬取犯罪的刑事風(fēng)險(xiǎn)。刑法一方面要提升防控?cái)?shù)據(jù)爬取犯罪的刑事風(fēng)險(xiǎn)之精準(zhǔn)性,另一方面又要保持必要限度,為數(shù)據(jù)合理使用與充分共享留下特定空間。為此,如果數(shù)字市場(chǎng)運(yùn)行機(jī)制以及強(qiáng)有力的監(jiān)管舉措已能有效防控?cái)?shù)據(jù)爬取犯罪的刑事風(fēng)險(xiǎn),那么刑法宜保持必要克制,不主動(dòng)懲治特定數(shù)據(jù)爬取情形。
提升代碼和算法對(duì)數(shù)據(jù)爬取犯罪的治理功效。借助入網(wǎng)訪問控制、網(wǎng)絡(luò)權(quán)限控制、目錄級(jí)控制與屬性控制等各種技術(shù)手段,不斷改進(jìn)網(wǎng)站訪問控制技術(shù),這些訪問控制技術(shù)雖然在信息技術(shù)原理上有所差別,但共性是都以代碼為核心。針對(duì)網(wǎng)絡(luò)爬蟲偽裝為其他爬蟲或者瀏覽器去大量爬取網(wǎng)站內(nèi)容,我們應(yīng)當(dāng)優(yōu)化被爬取網(wǎng)站監(jiān)測(cè)的算法設(shè)計(jì),即在算法模型中加強(qiáng)對(duì)網(wǎng)絡(luò)爬蟲的身份識(shí)別設(shè)計(jì),通過嵌入具有敏捷性的身份識(shí)別機(jī)制,提示網(wǎng)站管理員網(wǎng)絡(luò)爬蟲的真實(shí)身份,及時(shí)發(fā)現(xiàn)并追蹤數(shù)據(jù)爬取的后續(xù)過程。提升以代碼為核心的訪問控制技術(shù)和以算法為基礎(chǔ)的身份識(shí)別機(jī)制,有助于從技術(shù)層面有效防控?cái)?shù)據(jù)爬取犯罪的刑事風(fēng)險(xiǎn)。
。ㄗ髡撸骸趵钪t 作者單位:南京師范大學(xué)中國法治現(xiàn)代化研究院)
