摘要:以計(jì)算機(jī)軟件和大數(shù)據(jù)為支撐的文本數(shù)據(jù)挖掘技術(shù)已成為數(shù)字時(shí)代各行各業(yè)智能化發(fā)展的基礎(chǔ)工具。文本數(shù)據(jù)挖掘首先需要收集、復(fù)制海量數(shù)據(jù)或作品等受著作權(quán)法保護(hù)的信息建立數(shù)據(jù)庫(kù)。為學(xué)術(shù)研究目的而復(fù)制他人作品進(jìn)行文本數(shù)據(jù)挖掘,在越來越多的法域被視為合理使用。我國(guó)著作權(quán)立法中應(yīng)盡快確立以論文查重為代表的文本數(shù)據(jù)挖掘合理使用規(guī)則,以消除學(xué)術(shù)領(lǐng)域新技術(shù)應(yīng)用的侵權(quán)風(fēng)險(xiǎn)。具體說,可以在著作權(quán)法配套法規(guī)中明確,為教育和科研目的,可以復(fù)制他人作品,但不得公開發(fā)行和傳播。
關(guān)鍵詞:文本數(shù)據(jù)挖掘合理使用;論文查重;我國(guó)著作權(quán)立法
在知識(shí)和信息大爆炸的數(shù)字時(shí)代,僅由人腦對(duì)知識(shí)和數(shù)據(jù)信息進(jìn)行搜尋、整理、學(xué)習(xí)、記憶、統(tǒng)計(jì)、分析、處理和應(yīng)用越來越困難,同時(shí)知識(shí)和信息也無時(shí)不刻以數(shù)據(jù)形式產(chǎn)生和存儲(chǔ);因此,不僅產(chǎn)業(yè)升級(jí)轉(zhuǎn)型離不開人工智能技術(shù)和大數(shù)據(jù)資源的利用,傳統(tǒng)社會(huì)中的很多學(xué)習(xí)、研究、管理和組織活動(dòng)也需要技術(shù)輔助判斷、預(yù)測(cè)和決策。數(shù)字技術(shù)的開發(fā)和運(yùn)用成為人們適應(yīng)時(shí)代劇變的必然選擇,其中,利用計(jì)算機(jī)軟件技術(shù)對(duì)海量作品、數(shù)據(jù)等內(nèi)容進(jìn)行統(tǒng)計(jì)和分析,以得出有用信息的文本數(shù)據(jù)挖掘(Text & data mining,簡(jiǎn)稱TDM),已成為智能社會(huì)推動(dòng)產(chǎn)業(yè)和科技文化發(fā)展的基礎(chǔ)工具。
一、文本數(shù)據(jù)挖掘的復(fù)合功能及其著作權(quán)侵權(quán)風(fēng)險(xiǎn)
TDM是數(shù)據(jù)庫(kù)的伴生物,在信息時(shí)代具有多重應(yīng)用價(jià)值,其本質(zhì)是利用人工智能算法調(diào)取存儲(chǔ)于數(shù)據(jù)庫(kù)中的文本或各種智能設(shè)備產(chǎn)生的數(shù)據(jù),通過比對(duì)或重組信息資源發(fā)現(xiàn)其隱含的模型、趨勢(shì)或與某一設(shè)定目標(biāo)的相關(guān)性。精心設(shè)計(jì)的TDM不但具有廣泛的商業(yè)用途,也同樣為非營(yíng)利單位和人員節(jié)省了大量搜集、存儲(chǔ)、統(tǒng)計(jì)、分析資料的時(shí)間,極大地提高科學(xué)研究和管理決策的效率。
(一)依托數(shù)據(jù)庫(kù)開發(fā)的TDM應(yīng)用具有商業(yè)性
基于數(shù)據(jù)庫(kù)建設(shè)、采用“知識(shí)付費(fèi)”模式提供信息服務(wù)的TDM顯然具有商業(yè)用途,典型應(yīng)用場(chǎng)景包括輔助開發(fā)新技術(shù)、提煉商業(yè)信息、推送個(gè)性化娛樂資訊內(nèi)容等。例如,生產(chǎn)經(jīng)營(yíng)者可以利用實(shí)時(shí)數(shù)據(jù)分析使智能家居等產(chǎn)品或智慧健康等服務(wù)更加靈敏和精準(zhǔn)便捷,電商平臺(tái)的商家可以通過搜集統(tǒng)計(jì)用戶評(píng)價(jià)并據(jù)此有針對(duì)性地改善產(chǎn)品或服務(wù),文娛資訊產(chǎn)業(yè)經(jīng)營(yíng)者也可通過歷史記錄預(yù)測(cè)用戶喜好、推送關(guān)聯(lián)信息內(nèi)容或直接提供AI定制文創(chuàng)產(chǎn)品。對(duì)于建立此類數(shù)據(jù)庫(kù)和開發(fā)TDM應(yīng)用的主體來說,為營(yíng)利目的大量復(fù)制他人受著作權(quán)法保護(hù)的作品等內(nèi)容,應(yīng)遵循傳統(tǒng)的授權(quán)許可模式。[1]
新世紀(jì)以來,圍繞“數(shù)字圖書館”復(fù)制使用受保護(hù)作品是否需要事先授權(quán)的問題,我國(guó)互聯(lián)網(wǎng)產(chǎn)業(yè)界與原創(chuàng)內(nèi)容產(chǎn)業(yè)博弈激烈;主要原因就在于這類“數(shù)字圖書館”中的相當(dāng)一部分事實(shí)上屬于有償數(shù)據(jù)信息服務(wù)的提供者,而并非公益性圖書館等公共文化服務(wù)機(jī)構(gòu),[2]而且其提供的信息是被復(fù)制的作品等內(nèi)容本身,因此,我國(guó)的著作權(quán)立法一直能未明確與商業(yè)數(shù)據(jù)庫(kù)及其利用相關(guān)的權(quán)利限制與例外規(guī)則。換言之,商業(yè)數(shù)據(jù)庫(kù)經(jīng)營(yíng)者將受保護(hù)的作品等內(nèi)容數(shù)字化并納入在線數(shù)據(jù)庫(kù)向用戶提供閱覽、欣賞和下載時(shí),應(yīng)事先獲得權(quán)利人的授權(quán)。已有司法實(shí)踐表明,凡是以“數(shù)字圖書館”為名、未經(jīng)許可掃描他人作品并提供在線使用的行為,均被判定為侵權(quán);當(dāng)然,司法者也發(fā)現(xiàn)了“傳統(tǒng)型圖書館的數(shù)字化與數(shù)字化的非傳統(tǒng)型圖書館”二者在著作權(quán)侵權(quán)與否及責(zé)任承擔(dān)方面應(yīng)當(dāng)區(qū)別對(duì)待,遺憾的是立法上尚未給出可以靈活解釋的規(guī)則。[3]
(二)依托數(shù)據(jù)庫(kù)開發(fā)的TDM應(yīng)用可以具有公益性
我國(guó)在著作權(quán)立法傳統(tǒng)上對(duì)合理使用制度,采取的是類似歐洲各國(guó)明確列舉具體情形的方式,適用的主體是個(gè)人、政府、新聞單位、教學(xué)研究及圖書館等公共文化機(jī)構(gòu);且在這些非營(yíng)利性目的合理使用的規(guī)定中,[4]均有嚴(yán)格的數(shù)量、范圍和使用方式等限制。近年來,在線圖書館、網(wǎng)上展覽館博物館、智慧城市建設(shè)等新興事物發(fā)展迅速,我國(guó)著作權(quán)法立法顯然需要充分考慮到信息時(shí)代此類非營(yíng)利性活動(dòng)也離不開數(shù)據(jù)庫(kù)建設(shè)和TDM應(yīng)用的趨勢(shì)。[5] TDM需要對(duì)大量數(shù)據(jù)、包括受保護(hù)作品等信息進(jìn)行復(fù)制,而海量的作品信息及其龐雜來源使得數(shù)據(jù)庫(kù)制作者(通常也是TDM技術(shù)開發(fā)者)逐一核查權(quán)利狀態(tài)并取得授權(quán)成本高昂。本質(zhì)上說,為TDM目的而復(fù)制并不是為了提供作品本身,非營(yíng)利性使用對(duì)權(quán)利人的合法利益并不構(gòu)成沖擊。基于TDM在數(shù)字時(shí)代已成為開展學(xué)術(shù)活動(dòng)必不可少的工具,有必要考察如何消除其TDM的著作權(quán)侵權(quán)風(fēng)險(xiǎn)、以保障和推動(dòng)教育科研公共事業(yè)的發(fā)展。
從域外經(jīng)驗(yàn)看,歐盟2019年通過的單一數(shù)字市場(chǎng)版權(quán)及相關(guān)權(quán)指令,將非營(yíng)利性科研、文化遺產(chǎn)機(jī)構(gòu)為科學(xué)研究為目的進(jìn)行TDM而復(fù)制與提取合法獲得的作品等資料的行為視為合理使用,權(quán)利人不得通過授權(quán)條款排除使用;其他主體如果基于教學(xué)目的而以數(shù)字和跨境方式使用作品等資料,只要采取適當(dāng)措施確保這種利用僅限于機(jī)構(gòu)內(nèi)的學(xué)生或成員、并注明出處且權(quán)利人可以選擇退出,也不視為侵權(quán)。[6]美國(guó)版權(quán)法第107條關(guān)于合理使用判定的“四要素”沒有限定適用主體,在實(shí)踐中則通過判例來解釋規(guī)則。例如,谷歌公司在實(shí)施“谷歌圖書計(jì)劃”時(shí)掃描了海量圖書,因未經(jīng)許可的復(fù)制引發(fā)了侵權(quán)糾紛;在與作家協(xié)會(huì)多年的訴訟過程中,谷歌不斷調(diào)整其龐大圖書數(shù)據(jù)庫(kù)的信息服務(wù)方式,最終法院判定其掃描作品到數(shù)據(jù)庫(kù)中、但僅在網(wǎng)頁(yè)搜索結(jié)果上顯示片段內(nèi)容以便研究人員為學(xué)術(shù)目的使用的TDM行為屬于轉(zhuǎn)化性合理使用。[7]沿襲歐洲大陸成文法傳統(tǒng)的日本,在2018年修改著作權(quán)法時(shí)增加了確認(rèn)“用于信息情報(bào)分析的復(fù)制”屬于“非欣賞性”使用侵權(quán)例外的30-4(ii)等條款,但適用條件卻相對(duì)寬泛,使用對(duì)象不限于合法獲取的資料、使用方式也涵蓋了商業(yè)目的。[8]
我國(guó)著作權(quán)領(lǐng)域因數(shù)據(jù)庫(kù)及TDM應(yīng)用相關(guān)規(guī)則不明、滯后于數(shù)字技術(shù)發(fā)展的現(xiàn)狀,突出反映在近期我國(guó)知網(wǎng)(CNKI)引發(fā)的相關(guān)法律爭(zhēng)議中。
二、CNKI論文查重系統(tǒng)近期引發(fā)的法律爭(zhēng)議
(一)論文查重是學(xué)術(shù)管理的技術(shù)手段
我國(guó)很早就在教育、科技領(lǐng)域相關(guān)立法中明確了誠(chéng)信原則,[9]且不斷強(qiáng)化和細(xì)化相關(guān)規(guī)定,強(qiáng)調(diào)學(xué)風(fēng)建設(shè)和懲治學(xué)術(shù)不端行為,[10]并陸續(xù)頒發(fā)了相關(guān)文件、指南。[11]學(xué)術(shù)管理方面,學(xué)位論文評(píng)審工作一直由教育部統(tǒng)籌負(fù)責(zé),近期國(guó)家確定了由我國(guó)科技部、我國(guó)社科院分別統(tǒng)籌管理自然科學(xué)和社會(huì)科學(xué)的科研誠(chéng)信建設(shè)。[12]為執(zhí)行相關(guān)法律和政策,高校、研究機(jī)構(gòu)等學(xué)術(shù)單位和教育科研誠(chéng)信管理部門,在學(xué)位授予、期刊發(fā)表、報(bào)告提交、職稱評(píng)定等各個(gè)環(huán)節(jié)均對(duì)學(xué)術(shù)成果進(jìn)行檢測(cè)和評(píng)價(jià),以確保其創(chuàng)新性和原創(chuàng)性,實(shí)現(xiàn)相關(guān)立法及各種配套規(guī)范中強(qiáng)調(diào)的提高人才培養(yǎng)質(zhì)量、加強(qiáng)學(xué)術(shù)道德建設(shè)的要求。
抄襲即剽竊,是一種照抄他人的作品或其實(shí)質(zhì)性部分、作為自己的提交或發(fā)表的侵害著作權(quán)行為[13]。在以學(xué)術(shù)成果是否合格為考核指標(biāo)的教育和科研活動(dòng)中,抄襲是公認(rèn)的違背學(xué)術(shù)道德和科研誠(chéng)信、應(yīng)承擔(dān)相應(yīng)后果的行為。[14]實(shí)踐中,鑒于已發(fā)表的論文等作品材料數(shù)量龐大,由評(píng)審專家人工判斷是否抄襲或剽竊越來越難以執(zhí)行,作為大多數(shù)學(xué)術(shù)機(jī)構(gòu)審查學(xué)術(shù)不端的輔助技術(shù)手段,“論文查重”在我國(guó)應(yīng)運(yùn)而生。論文查重是利用計(jì)算機(jī)軟件技術(shù)查詢、檢測(cè)、記錄論文等學(xué)術(shù)成果與已經(jīng)發(fā)表的論文等對(duì)比材料之間的重復(fù)率,據(jù)此判定該成果是否存在抄襲及其原創(chuàng)程度的一種方法。盡管算法的科學(xué)性周延性有時(shí)會(huì)受到質(zhì)疑、人工復(fù)核程序也不時(shí)啟動(dòng),但智能化的論文查重系統(tǒng)幾乎已成為所有學(xué)術(shù)機(jī)構(gòu)和管理部門發(fā)現(xiàn)并制止學(xué)術(shù)不端行為的必備工具。
(二)中國(guó)知網(wǎng)是目前我國(guó)學(xué)界公認(rèn)的權(quán)威論文查重系統(tǒng)
論文查重是個(gè)系統(tǒng)工程,既需要算法功能強(qiáng)大的計(jì)算機(jī)軟件和相匹配的服務(wù)器、云計(jì)算平臺(tái)等硬件環(huán)境,也需要全面收錄報(bào)紙期刊、碩博學(xué)位論文及圖書等已有成果建立的查重?cái)?shù)據(jù)庫(kù)。盡管國(guó)內(nèi)外有諸多在線文獻(xiàn)數(shù)查重軟件,在我國(guó)最具代表性和權(quán)威性的是中國(guó)知網(wǎng)(CNKI)查重系統(tǒng);[15]這是因?yàn)檎撐牟橹仉x不開數(shù)據(jù)庫(kù),而數(shù)據(jù)庫(kù)建設(shè)需要極大的投入,單個(gè)學(xué)術(shù)機(jī)構(gòu)難以完成,因此轉(zhuǎn)而通過購(gòu)買專業(yè)數(shù)據(jù)庫(kù)及其查重服務(wù)的方式。目前,CNKI收錄的文獻(xiàn)總量超過2億篇,[16]是國(guó)內(nèi)最大學(xué)術(shù)文獻(xiàn)數(shù)據(jù)庫(kù),其查重系統(tǒng)也被各學(xué)術(shù)機(jī)構(gòu)同時(shí)采用;因該查重系統(tǒng)僅對(duì)學(xué)術(shù)機(jī)構(gòu)開放,個(gè)人需求只能通過電商平臺(tái)購(gòu)買機(jī)構(gòu)賬號(hào)使用權(quán)的違規(guī)方式實(shí)現(xiàn),不但花錢而且可能花冤枉錢,可謂亂象叢生。[17]
CNKI是數(shù)字學(xué)術(shù)資源集成商,巨大的成本投入和經(jīng)營(yíng)規(guī)模決定了其采取市場(chǎng)化運(yùn)作方式、通過知識(shí)產(chǎn)品和服務(wù)獲利。我國(guó)的高校畢業(yè)生每年數(shù)量達(dá)近千萬,另外還有大量教學(xué)科研人員的期刊發(fā)表、課題結(jié)項(xiàng)、圖書出版等需要進(jìn)行成果檢測(cè),應(yīng)該說,我國(guó)的論文查重服務(wù)市場(chǎng)需求巨大。問題在于,個(gè)人為避免科研誠(chéng)信出現(xiàn)問題而自發(fā)產(chǎn)生的市場(chǎng)需求,與學(xué)術(shù)機(jī)構(gòu)及國(guó)家教育科研誠(chéng)信主管部門履行公共管理職能的需求怎么區(qū)分?近期CNKI相關(guān)爭(zhēng)議反映出目前各界對(duì)這一問題的認(rèn)識(shí)還需要進(jìn)一步理清。
(三)CNKI近期引起關(guān)注的著作權(quán)和壟斷爭(zhēng)議
作為商業(yè)主體,CNKI在數(shù)據(jù)庫(kù)建設(shè)過程中為了避免著作權(quán)侵權(quán)風(fēng)險(xiǎn),盡量采取了事先取得授權(quán)的模式,但其海量學(xué)術(shù)資源中仍有很多著作權(quán)狀況不清晰,因?yàn)镃NKI是與高校和報(bào)刊雜志社、而不是與作者本人簽訂合同。實(shí)踐中,學(xué)生辦理畢業(yè)手續(xù)時(shí)須簽字確認(rèn)同意論文電子版被有關(guān)數(shù)據(jù)庫(kù)收錄,作者投稿時(shí)須默認(rèn)期刊雜志上關(guān)于全文將被有關(guān)數(shù)據(jù)庫(kù)收錄的聲明;但這種方式是否意味著CNKI可以根據(jù)與高校或期刊報(bào)社的合同獲得單篇論文的數(shù)字化復(fù)制權(quán)和信息網(wǎng)絡(luò)傳播權(quán)許可,在理論上是存疑的。我國(guó)《民法典》第497、498條對(duì)格式條款及其解釋原則做出了有利于被動(dòng)接受一方的規(guī)定;司法實(shí)踐中,法院也通常會(huì)據(jù)此做出有利于權(quán)利人的裁判。例如,在趙德馨一案中,法院認(rèn)為,《著作權(quán)法》第33條第2款規(guī)定的報(bào)刊轉(zhuǎn)載法定許可制度并不適用于網(wǎng)絡(luò)環(huán)境,CNKI也未提交證據(jù)證明作者曾向刊文單位進(jìn)行信息網(wǎng)絡(luò)傳播權(quán)授權(quán),故不支持CNKI稱涉案文章有合法來源的主張。[18]理論界多數(shù)觀點(diǎn)也認(rèn)為,CNKI在碩博學(xué)位論文和期刊論文兩大文獻(xiàn)來源方面均存在問題。[19]
除了著作權(quán)侵權(quán),有關(guān)CNKI的爭(zhēng)議還包括被指涉嫌壟斷。CNKI數(shù)據(jù)庫(kù)開發(fā)時(shí)的最初定位是“國(guó)家知識(shí)基礎(chǔ)設(shè)施”,即教育科研的基本工具,但因此類知識(shí)數(shù)據(jù)庫(kù)及其查重應(yīng)用供給單一,引起了CNKI對(duì)學(xué)生和科研單位收取高額費(fèi)用、限制公眾學(xué)術(shù)創(chuàng)新活動(dòng)的壟斷爭(zhēng)議。[20]對(duì)此,2022年4月25日,國(guó)家市場(chǎng)監(jiān)督管理總局表示正在依法開展相關(guān)工作。[21]
三、我國(guó)著作權(quán)立法體系及合理使用制度的構(gòu)造
從立法模式看,大多數(shù)國(guó)家的著作權(quán)立法將具體的制度規(guī)范盡量納入法律中,條文規(guī)定比較詳細(xì),多則上千條(例如美國(guó))、少則上百條(例如日本、巴西),多為200條左右(例如歐洲各國(guó)、澳大利亞、新加坡、埃及等)。不過,我國(guó)的模式稍有不同,《著作權(quán)法》僅有67條(2020年11月11日修改之前是61條),條文篇幅明顯簡(jiǎn)短、精煉;這是因?yàn)槲覈?guó)著作權(quán)法立法采取的是“基本法律+配套法規(guī)”的組合模式,即在《著作權(quán)法》中以條款指示“法律、行政法規(guī)規(guī)定的其他情形”“由國(guó)務(wù)院另行規(guī)定”的方式表述,涉及的更詳細(xì)具體的規(guī)則、措施由配套法規(guī)和規(guī)章來構(gòu)建。事實(shí)上,我國(guó)著作權(quán)立法體系的全貌是“1+5”架構(gòu),即以《著作權(quán)法》為基干,再加上《著作權(quán)法實(shí)施條例》《計(jì)算機(jī)軟件保護(hù)條例》《著作權(quán)集體管理?xiàng)l例》《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》以及擬制定的《民間文學(xué)藝術(shù)作品的保護(hù)條例》作為配套行政法規(guī)。
著作權(quán)限制與例外,學(xué)理上也稱“合理使用”[22],是各國(guó)著作權(quán)法上十分重要的利益平衡機(jī)制,也是我國(guó)《著作權(quán)法》2020年修訂的主要關(guān)注點(diǎn)之一;最終的立法文本在引入《伯爾尼公約》“三步檢驗(yàn)法”表述[23]的同時(shí),在舊法列舉的12項(xiàng)具體情形之外,增加了“法律、行政法規(guī)規(guī)定的其他情形”的鏈接式規(guī)定。這意味著,若有應(yīng)當(dāng)視為合理使用的新情形出現(xiàn),需要經(jīng)由立法程序以法律、法規(guī)予以明確,而不是交由司法者個(gè)案判定。學(xué)界對(duì)此多有批評(píng),因?yàn)榇舜涡薹ㄔ跈?quán)利客體、權(quán)利內(nèi)容、技術(shù)保護(hù)措施、侵權(quán)責(zé)任等都做了諸多應(yīng)對(duì)數(shù)字時(shí)代發(fā)展的修改,強(qiáng)化了對(duì)權(quán)利人的保護(hù),賦予了司法機(jī)關(guān)足夠的法律解釋空間;但在作為權(quán)利人和公眾之間利益平衡機(jī)制的合理使用制度上,立法卻沒有建立起同樣可以靈活適用的彈性裁量規(guī)則。這樣,對(duì)于實(shí)踐中已有一定共識(shí)、國(guó)外也有相關(guān)立法或司法經(jīng)驗(yàn)可借鑒的應(yīng)視為合理使用情形,在我國(guó)須盡快通過法律、法規(guī)做出規(guī)定,以維系權(quán)利人與公共利益的平衡;例如,視聽作品、錄音錄像制品制作中作為背景的瞬間偶然呈現(xiàn)或附帶性使用,為教育科學(xué)研究進(jìn)行TDM而復(fù)制,群眾自發(fā)性?shī)蕵坊顒?dòng)中的免費(fèi)表演等。
從我國(guó)的立法程序規(guī)定和著作權(quán)領(lǐng)域的立法體系看,以《著作權(quán)法》配套法規(guī)對(duì)合理使用情形加以明確是最便捷有效的做法。以TDM侵權(quán)例外為例,可盡快將其納入目前我國(guó)正在修改的《著作權(quán)法實(shí)施條例》。當(dāng)然,同樣是TDM合理使用,各國(guó)的立法例或判例不盡相同,這與國(guó)情差異相關(guān);適應(yīng)我國(guó)國(guó)情的TDM合理使用規(guī)則個(gè)案中如何適用,是司法實(shí)踐中需要闡釋的問題。
四、我國(guó)著作權(quán)立法中數(shù)據(jù)挖掘侵權(quán)例外規(guī)則的構(gòu)建
(一)僅限于為學(xué)術(shù)目的而復(fù)制
TDM本身是一種創(chuàng)新成果、且有著越來越廣泛的用途,但其算法的執(zhí)行首先需要獲取海量受保護(hù)資料,才能上傳至云計(jì)算平臺(tái)進(jìn)行解析、加工和呈現(xiàn)、傳輸結(jié)果,這一過程如果未經(jīng)許可使用他人作品,涉嫌侵犯復(fù)制、演繹、信息網(wǎng)絡(luò)傳播等權(quán)利;如果TDM運(yùn)營(yíng)者與數(shù)據(jù)庫(kù)建設(shè)者不是同一主體或無關(guān)聯(lián),未經(jīng)許可抓取他人數(shù)據(jù)庫(kù)中的海量?jī)?nèi)容使用還涉嫌進(jìn)行不正當(dāng)競(jìng)爭(zhēng)。鑒于TDM應(yīng)用今后能為商業(yè)主體創(chuàng)造市場(chǎng)價(jià)值,例如能夠“作詩(shī)、作曲、作畫”的人工智能軟件或各種名目的“智能機(jī)器人”設(shè)備,開發(fā)目的是作為文化娛樂產(chǎn)品營(yíng)銷而并非為了學(xué)術(shù)活動(dòng),其使用大量受保護(hù)作品來產(chǎn)生AI生成物的行為就不應(yīng)適用著作權(quán)侵權(quán)例外;這種雖然沒有直接提供他人作品內(nèi)容、但仍利用了他人作品信息來營(yíng)利的行為,權(quán)利人和使用人雙方如何達(dá)成利益分享合意應(yīng)交由市場(chǎng)解決,而不是以著作權(quán)法上平衡公共利益與權(quán)利人利益的合理使用制度來強(qiáng)制規(guī)范。易言之,TDM合理使用應(yīng)僅限于非營(yíng)利性的教育和科研領(lǐng)域,以保障數(shù)字時(shí)代的學(xué)術(shù)活動(dòng)這一社會(huì)公共事業(yè)能夠與時(shí)俱進(jìn)地開展。除了查重,TDM在學(xué)術(shù)上的典型應(yīng)用還包括各學(xué)科與人工智能的交融[24]和“數(shù)字人文”新范式,[25]這種以TDM開展科研活動(dòng)的趨勢(shì),需要以各種各樣與之匹配的知識(shí)數(shù)據(jù)庫(kù)為基礎(chǔ),合理使用制度能夠消除其著作權(quán)侵權(quán)風(fēng)險(xiǎn),有助于推動(dòng)教育科學(xué)研究。
(二)使用方式不延及被復(fù)制作品的后續(xù)傳播
作為侵權(quán)例外,須明確TDM使用作品的具體方式。我國(guó)在近期修改《著作權(quán)法實(shí)施條例》增設(shè)侵權(quán)例外條款、允許為學(xué)術(shù)目的而復(fù)制他人作品以便執(zhí)行TDM時(shí),需要明確所復(fù)制的作品只能用于執(zhí)行TDM本身;如果用于后續(xù)的營(yíng)利性活動(dòng),例如將數(shù)據(jù)庫(kù)中的作品有償提供全文瀏覽和下載,則屬于需要另行獲得權(quán)利人許可的復(fù)制發(fā)行和網(wǎng)絡(luò)傳播行為。在前述谷歌案中,圖書搜索方式最終僅限于學(xué)術(shù)目的、且公眾只能免費(fèi)瀏覽文獻(xiàn)片段,這種“轉(zhuǎn)化性使用”之所以被判定為合理使用,是因?yàn)槠渑c紙書時(shí)代權(quán)利人普遍容忍的讀者在圖書館或書店的翻閱類似;若整本提供圖書復(fù)制件,必然難以擺脫侵權(quán)責(zé)任。
(三)開發(fā)和執(zhí)行TDM的主體不必須是學(xué)術(shù)機(jī)構(gòu)
結(jié)合國(guó)情和域外經(jīng)驗(yàn),具體執(zhí)行TDM主體和復(fù)制資料的來源可不作嚴(yán)格限制,但使用目的和方式需明確為教育科研等學(xué)術(shù)活動(dòng)。例如,CNKI已建成我國(guó)最大的學(xué)術(shù)資源數(shù)據(jù)庫(kù),再由學(xué)術(shù)管理部門和各學(xué)術(shù)機(jī)構(gòu)另起爐灶建設(shè)用于查重的知識(shí)數(shù)據(jù)庫(kù)需要極大財(cái)政投入。因此,僅就論文查重這樣的TDM應(yīng)用而言,在著作權(quán)立法上確立為教育科研目的執(zhí)行TDM而復(fù)制他人作品屬于合理使用后,學(xué)術(shù)主管部門和各學(xué)術(shù)機(jī)構(gòu)可以繼續(xù)使用CNKI查重系統(tǒng);因該系統(tǒng)所需的數(shù)據(jù)庫(kù)開發(fā)、算法準(zhǔn)確和權(quán)威性的維護(hù)需要相當(dāng)多的成本,各學(xué)術(shù)機(jī)構(gòu)應(yīng)向CNKI經(jīng)營(yíng)者支付一定的使用費(fèi)以彌補(bǔ),但支付標(biāo)準(zhǔn)應(yīng)當(dāng)像公共交通等基礎(chǔ)設(shè)施一樣,由主管部門給予指導(dǎo)并予以公布、而不是由CNKI自行定價(jià)。當(dāng)然,這一使用費(fèi)也可打包計(jì)算在學(xué)術(shù)機(jī)構(gòu)購(gòu)買CNKI數(shù)據(jù)庫(kù)服務(wù)的費(fèi)用中。對(duì)于教育和科研人員的需求而言,學(xué)術(shù)機(jī)構(gòu)購(gòu)買的查重服務(wù)已經(jīng)涵蓋了為個(gè)人提供的免費(fèi)檢測(cè)的合理次數(shù),因此超出之外的應(yīng)由個(gè)體按收費(fèi)標(biāo)準(zhǔn)自己買單。
綜上,我國(guó)著作權(quán)立法亟需設(shè)立TDM侵權(quán)例外以適應(yīng)數(shù)字技術(shù)的發(fā)展,本文提出該例外制度的構(gòu)建路徑及具體規(guī)則如下:
1、在我國(guó)的《著作權(quán)法實(shí)施條例》中增加TDM例外的規(guī)定,具體可以在第X條中明確:“下列情形,屬于著作權(quán)法第二十四條第(十三)項(xiàng)規(guī)定的‘其他情形’:……(x)為教育和科學(xué)研究目的,復(fù)制已經(jīng)發(fā)表的作品并提取相關(guān)數(shù)據(jù)信息進(jìn)行統(tǒng)計(jì)分析,但不得將復(fù)制的作品公開發(fā)行和傳播……”。
2、實(shí)踐中通過司法解釋和個(gè)案判定TDM合理使用的適用條件
1)不強(qiáng)調(diào)適用主體必須是非營(yíng)利性教育科研和公共文化機(jī)構(gòu),商業(yè)主體為學(xué)術(shù)目的也可復(fù)制作品用于TDM,但僅就此收取合理的使用費(fèi)。
2)權(quán)利人不得在作品授權(quán)合同中以格式條款或聲明,或者采取技術(shù)措施等方式排除TDM合理使用,以免該制度淪為擺設(shè)。
3)明確為TDM合理使用而復(fù)制使用他人作品僅限于非營(yíng)利性教育科研目的,不包括廣義的開發(fā)新產(chǎn)品或方法的商業(yè)性研發(fā)活動(dòng)。
4)使用方式僅限于復(fù)制作品以便提取信息進(jìn)行統(tǒng)計(jì)分析,不得延伸到將復(fù)制的作品出版發(fā)行或通過各種方式公開傳播。
【注釋】
[1]此類數(shù)據(jù)庫(kù)也涉及個(gè)人信息和數(shù)據(jù)財(cái)產(chǎn)保護(hù)問題,本文對(duì)此不展開討論。
[2]參見鄭成思:《圖書館、網(wǎng)絡(luò)服務(wù)商、網(wǎng)絡(luò)盜版與“利益平衡”——我國(guó)社科院七位學(xué)者維權(quán)實(shí)踐的理論貢獻(xiàn)》,載《社會(huì)科學(xué)管理與評(píng)論》2005年第3期,第81-86頁(yè)。
[3]參見趙靜:《從司法審判看我國(guó)數(shù)字圖書館建設(shè)中的著作權(quán)法律適用問題》,載《科技與法律》2005年第3期,第78-84頁(yè)。
[4]參見我國(guó)《著作權(quán)法》第24條(六)(七)(八)項(xiàng),《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》第6、7條。
[5]當(dāng)然,問題不僅存在于著作權(quán)領(lǐng)域,個(gè)人信息的使用同樣需要建立相關(guān)規(guī)則。
[6]See European Union: Directive (EU) 2019/790 of the European Parliament and of the Council of 17 April 2019 on copyright and related rights in the Digital Single Market and amending Directives 96/9/EC and 2001/29/EC, Article 2, 3, 4.
[7] See Authors Guild, Inc. v. Google Inc., 804 F.3d 202 (2d Cir. 2015).
[8]See Tatsuhiro Ueno:The Flexible Copyright Exception for “Non-Enjoyment” Purposes ‒ Recent Amendment in Japan and Its Implication,GRUR International(《歐盟及國(guó)際知識(shí)產(chǎn)權(quán)法》雜志), Volume 70, Issue 2, February 2021, Pages 145–152.
[9]例如,《中華人民共和國(guó)學(xué)位條例》(1980年2月12日通過)第17條;《中華人民共和國(guó)科技進(jìn)步法》(1993年7月2日通過)第60條;《中華人民共和國(guó)高等教育法》(1998年8月29日通過)第42條(2015年該法修改時(shí)專門明確了學(xué)術(shù)事項(xiàng)的范圍,其中第四項(xiàng)即調(diào)查、認(rèn)定學(xué)術(shù)不端行為)。
[10]學(xué)術(shù)不端行為指違反公認(rèn)的學(xué)術(shù)準(zhǔn)則、違背學(xué)術(shù)誠(chéng)信的行為,如剽竊、抄襲、侵占他人學(xué)術(shù)成果等,參見2016年9月1日起施行的教育部《高等學(xué)校預(yù)防與處理學(xué)術(shù)不端行為辦法》第2條、27條。
[11]例如1999 年《關(guān)于科技工作者行為準(zhǔn)則的若干意見》,2002 年《關(guān)于加強(qiáng)學(xué)術(shù)道德建設(shè)的若干意見 》, 2004 年《高等學(xué)校哲學(xué)社會(huì)科學(xué)研究學(xué)術(shù)規(guī)范(試行)》。
[12]參見2018年5月中共中央辦公廳、國(guó)務(wù)院辦公廳印發(fā)的《關(guān)于進(jìn)一步加強(qiáng)科研誠(chéng)信建設(shè)的若干意見》。
[13]參見《中華人民共和國(guó)著作權(quán)法》(2020年11月11日修改)第52條:有下列侵權(quán)行為的,應(yīng)當(dāng)根據(jù)情況,承擔(dān)停止侵害、消除影響、賠禮道歉、賠償損失等民事責(zé)任……(五)剽竊他人作品的……。
[14]例如2012年6月12日教育部通過的《學(xué)位論文作假行為處理辦法》。
[15]CNKI學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)網(wǎng)址:https://check.cnki.net/。
[16]參見文競(jìng)擇:《我國(guó)知網(wǎng)被起訴涉嫌壟斷,杭州中院已立案調(diào)查》,騰訊網(wǎng):https://new.qq.com/omn/20220504/20220504A01YIT00.html,2022 年9 月 22日訪問。
[17]詳細(xì)情況參見新京報(bào):《為了通過查重,畢業(yè)生們要花多少錢?》,新京報(bào)官網(wǎng)網(wǎng)址:https://www.bjnews.com.cn/detail/165400365014452.html,2022年9月31日訪問。
[18]參見北京互聯(lián)網(wǎng)法院(2021)京0491民初31522號(hào)民事判決書。
[19]參見郭玉潔:《知網(wǎng)之網(wǎng)》,載于《我國(guó)青年報(bào)》2022年2月9日第7版。
[20]參見孫晉、袁野:《學(xué)術(shù)數(shù)據(jù)庫(kù)經(jīng)營(yíng)者不公平高價(jià)行為的規(guī)制困局及其破解》,載于《現(xiàn)代法學(xué)》2019 年第 5 期,第89-104頁(yè)。
[21]參見于琦:《深陷爭(zhēng)議旋渦,知網(wǎng)是否涉嫌壟斷?市場(chǎng)監(jiān)管總局:正依法開展相關(guān)工作》,央廣網(wǎng):http://finance.cnr.cn/2014jingji/yw/20220426/t20220426_525807143.shtml,2022年10月25日訪問。
[22]參見吳漢東:《著作權(quán)合理使用制度研究》(第三版),我國(guó)人民大學(xué)出版社2013年版,第5頁(yè)。
[23]我國(guó)《著作權(quán)法》第24條:在下列情況下使用作品,可以不經(jīng)著作權(quán)人許可,不向其支付報(bào)酬,但應(yīng)當(dāng)指明作者姓名或者名稱、作品名稱,并且不得影響該作品的正常使用,也不得不合理地?fù)p害著作權(quán)人的合法權(quán)益……(十三)法律、行政法規(guī)規(guī)定的其他情形。
[24] See Yongjun Xu, et al., Artificial Intelligence: A Powerful Paradigm for Scientific Research, The Innovation 2-4(2021), 100-179;https://www.cell.com/the-innovation/fulltext/S2666-6758(21)00104-1#relatedArticles.
[25]參見王曉光、陳靜:《數(shù)字人文打開文化新視野》,載于《人民日?qǐng)?bào)》2020年2月25日第20版。
作者:管育鷹,中國(guó)社會(huì)科學(xué)院知識(shí)產(chǎn)權(quán)中心主任,研究員。
來源:《中國(guó)版權(quán)》2022年第6期。此為完整版,發(fā)表時(shí)有修改。
責(zé)任編輯:譚則章
