作者:高玉光北京市信利(深圳)律師事務(wù)所2023/05/04于深圳#本文僅代表作者觀點(diǎn),未經(jīng)作者許可,禁止轉(zhuǎn)載# 近日,歐洲議會(huì)成員就《人工智能法(The AI Act)》提案達(dá)成臨時(shí)政治協(xié)議,要求部署ChatGPT等生成式人工智能工具的公司披露用于開發(fā)其系統(tǒng)的受版權(quán)保護(hù)的材料。該協(xié)議可能是為世界上第一部《人工智能法》的出臺(tái)鋪平道路。[1]
什么是生成式AI?
生成式AI指的是一類人工智能(AI)算法,它根據(jù)訓(xùn)練過的數(shù)據(jù)生成新的輸出。與傳統(tǒng)人工智能系統(tǒng)旨在識(shí)別模式和做出預(yù)測(cè)不同,生成式AI有廣泛的應(yīng)用,主要包括: 1、圖像: 生成式AI可以在現(xiàn)有圖像的基礎(chǔ)上創(chuàng)建新的圖像,比如根據(jù)一個(gè)人的臉創(chuàng)建一個(gè)新的肖像,或者根據(jù)現(xiàn)有的風(fēng)景創(chuàng)建一個(gè)新的風(fēng)景。2、文本: 生成式AI可以用來寫新聞文章、詩歌,甚至腳本。它還可以用于將文本從一種語言翻譯成另一種語言。3、娛樂: 生成式AI可以創(chuàng)造新的視頻游戲、電影和電視節(jié)目,使內(nèi)容創(chuàng)作者更容易接觸到新的受眾。[2]比如自然語言處理工具ChatGPT,這是一種用于處理序列數(shù)據(jù)的模型,通過連接大量的語料庫來訓(xùn)練模型,這些語料庫包含了真實(shí)世界中的對(duì)話,使得ChatGPT具備擁有語言理解和文本生成能力。與之類似,谷歌工程師使用1.6萬個(gè)CPU打造了一個(gè)深度學(xué)習(xí)網(wǎng)絡(luò),用來指導(dǎo)計(jì)算機(jī)畫出貓臉的圖片。當(dāng)時(shí)他們搜集了來自網(wǎng)絡(luò)上的1000萬張貓臉的照片,AI利用這個(gè)網(wǎng)絡(luò)生成了一張非常模糊的貓臉。
生成式AI“創(chuàng)作”原理是什么?
以ChatGPT為例,我們知道互聯(lián)網(wǎng)搜索引擎,如谷歌、百度等,能夠進(jìn)行大量的數(shù)據(jù)庫查找,并提供一系列可能會(huì)回答你查詢的匹配項(xiàng)。ChatGPT的強(qiáng)大功能在于能夠根據(jù)其接受過訓(xùn)練的大量文本數(shù)據(jù)生成所謂的語料庫,用以解釋特定查詢的上下文和含義,并以語法正確的自然語言生成相關(guān)答案,從而能夠以類似人類的方式就幾乎任何話題進(jìn)行有效的交流。其原理在于AI本身有一個(gè)知識(shí)庫,這個(gè)知識(shí)庫接受了來自書籍、互聯(lián)網(wǎng)、新聞、小說、科技論文期刊及其他數(shù)據(jù)等作為訓(xùn)練材料。這些訓(xùn)練材料不斷更新并持續(xù)輸入到上述知識(shí)庫。ChatGPT的核心組成部分是一個(gè)很深的多層神經(jīng)網(wǎng)絡(luò),這個(gè)神經(jīng)網(wǎng)絡(luò)使用了一種稱為“Transformer”(轉(zhuǎn)換器)的架構(gòu),這個(gè)架構(gòu)允許模型同時(shí)處理多個(gè)輸入,并能夠注意到輸入之間的關(guān)聯(lián)性。通過大規(guī)模訓(xùn)練AI神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)語言模型,然后使用這個(gè)語言模型來生成自然流暢的文本或完成其他自然語言處理任務(wù)。[3] 為了能自我提升,ChatGPT同時(shí)應(yīng)用一種稱為生成式對(duì)抗網(wǎng)絡(luò)(GAN)的深度學(xué)習(xí)來創(chuàng)建新內(nèi)容。GAN由兩個(gè)神經(jīng)網(wǎng)絡(luò)組成: 創(chuàng)建新數(shù)據(jù)的生成器和評(píng)估數(shù)據(jù)的鑒別器。生成器和鑒別器一起工作,生成器根據(jù)從鑒別器接收到的反饋改進(jìn)輸出,直到生成與真實(shí)數(shù)據(jù)難以區(qū)分的內(nèi)容。為了生成高質(zhì)量、多樣性和流暢的自然語言文本,ChatGPT還應(yīng)用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)及注意力機(jī)制(Attention)等深度學(xué)習(xí)技術(shù)。換句話說,AI創(chuàng)作的原理是:對(duì)人類輸入的指令或問題,AI基于知識(shí)庫中的素材(客觀事實(shí))利用算法生成一個(gè)預(yù)測(cè)答案,人類如果認(rèn)為答案有偏離則進(jìn)一步輸入具體指令,AI利用算法再生成一個(gè)修正答案,如此反復(fù),AI最終生成一個(gè)讓人類較為滿意的答案模型。在反復(fù)試錯(cuò)及改進(jìn)過程中,AI會(huì)總結(jié)人類指令與生成模型之間的規(guī)律,并將其作為今后的“行動(dòng)綱領(lǐng)”。
“創(chuàng)新”O(jiān)R“抄襲”?
筆者認(rèn)為,從知識(shí)產(chǎn)權(quán)角度,創(chuàng)新可以分為組合式創(chuàng)新、轉(zhuǎn)用式創(chuàng)新、衍生式創(chuàng)新、開拓式創(chuàng)新。組合式創(chuàng)新指的是將現(xiàn)有素材或技術(shù)組合起來,產(chǎn)生一種新的素材或技術(shù);例如鉛筆和橡皮是現(xiàn)有素材,將兩者組合在一起生成一端帶橡皮的鉛筆。轉(zhuǎn)用式創(chuàng)新指將某一產(chǎn)品的素材應(yīng)用到另一產(chǎn)品用途中,如將飛機(jī)的主翼應(yīng)用到潛水艇上作為潛水翼。衍生式創(chuàng)新是最為常見的創(chuàng)新形式,指將原有技術(shù)做微小的改進(jìn)使其性能更佳,如將手表的指針添加熒光材料,使其夜間可視。開拓式創(chuàng)新是指前所未有的重大創(chuàng)新,如汽車、電話機(jī)、電視機(jī)、電腦及互聯(lián)網(wǎng)等的發(fā)明。
如上所述,AI是利用人類現(xiàn)有知識(shí)庫素材利用算法生成模型。所以,AI在訓(xùn)練和學(xué)習(xí)過程中,會(huì)不可避免地使用人類現(xiàn)有作品,如果該種行為不符合法律規(guī)定的合理使用情形,則必然會(huì)存在侵犯他人知識(shí)產(chǎn)權(quán)的風(fēng)險(xiǎn)。而AI在“創(chuàng)作”圖像、文字或電影電視作品時(shí),是根據(jù)素材、模型及反饋機(jī)制總結(jié)規(guī)律,最后生成“作品”,該作品是人類智力成果的“拼湊”或“仿制”,即AI目前的“創(chuàng)作”屬于組合式創(chuàng)新或轉(zhuǎn)用式創(chuàng)新,其離不開人類素材庫這個(gè)框框。至少在現(xiàn)階段,AI還無法完全擺脫人類的智力成果做出衍生式或開拓式的創(chuàng)新。而前述組合式創(chuàng)作或轉(zhuǎn)用式創(chuàng)作可能具有一定新穎性,但站在相關(guān)領(lǐng)域一般消費(fèi)者角度來看,這種創(chuàng)作可能是顯而易見的,不構(gòu)成真正的創(chuàng)新。但AI作品中如果包括了他人在先的作品或作品核心部分,甚至包括了他人的隱私或商業(yè)秘密權(quán),則無疑會(huì)存在侵權(quán)的風(fēng)險(xiǎn)。例如前不久,馬里蘭大學(xué)和紐約大學(xué)的研究團(tuán)隊(duì)進(jìn)行了一項(xiàng)研究,對(duì)DALL-E2、Stable Diffusion等模型生成的圖片與訓(xùn)練數(shù)據(jù)中的圖片進(jìn)行了對(duì)比。結(jié)果發(fā)現(xiàn),在生成圖片中,有約1.88%的圖片和訓(xùn)練集中的某個(gè)圖片相似度超過了50%。顯然,這可能構(gòu)成對(duì)原圖片著作權(quán)中“改編權(quán)”的侵犯。此外,如果將這些生成的圖片在網(wǎng)上進(jìn)行傳播,還可能構(gòu)成侵犯“信息網(wǎng)絡(luò)傳播權(quán)”等問題。[4] 最近,有關(guān)版權(quán)侵權(quán)的爭(zhēng)議始終圍繞著AI公司:圖片發(fā)行商Getty Images起訴Stable Diffusion使用有版權(quán)的照片來訓(xùn)練其系統(tǒng)。OpenAI也因拒絕分享用于訓(xùn)練其軟件的數(shù)據(jù)集的細(xì)節(jié)而面臨批評(píng)。
結(jié)語
各國著作權(quán)法的立法宗旨都是鼓勵(lì)作者各施所長,各盡所能,獨(dú)立創(chuàng)作出豐富多彩的作品,正所謂提倡“百花齊放,百家爭(zhēng)鳴”,從而促進(jìn)文學(xué)、藝術(shù)及科學(xué)領(lǐng)域的繁榮與發(fā)展。著作權(quán)法不保護(hù)思想,而只保護(hù)思想的表達(dá)形式。因?yàn)橹鳈?quán)法表象目標(biāo)是提供著作權(quán)人一定期間的壟斷權(quán),從而激發(fā)作者的創(chuàng)作熱情。但著作權(quán)法終極目標(biāo)是為了促進(jìn)思想繁榮及社會(huì)進(jìn)步。所以思想應(yīng)該是自由的, 如果思想被壟斷了, 等于思想的傳播被人為阻斷了,則會(huì)禁錮后人的想象力和創(chuàng)造力。AI在現(xiàn)階段尚不具備獨(dú)立思想及開拓式創(chuàng)新的能力,擬出臺(tái)的人工智能法將對(duì)AI的開發(fā)者及使用者提出更高的要求,即如何借鑒他人的思想,在不侵犯他人合法權(quán)益前提下,應(yīng)用AI創(chuàng)作出衍生式甚至開拓式創(chuàng)新作品,但彼時(shí),距離AI在各領(lǐng)域全面取代人類也為時(shí)不遠(yuǎn)了。
參考文獻(xiàn):
[1] 華爾街見聞:《歐盟達(dá)成《人工智能法》協(xié)議,為生成式AI設(shè)立版權(quán)規(guī)則》,來源:澎湃新聞 04-28 13:17。
[2] 非凡科普:鏈接:https://www.zhihu.com/pin/1605674940094783489?utm_id=0,發(fā)布于 2023-02-05 21:12?IP 屬地北京,來源:知乎,最后訪問時(shí)間:2023年05月02日。
[3] 量子認(rèn)知:《簡(jiǎn)單解釋:ChatGPT到底是如何工作的?》2023-04-14 01:26, https://baijiahao.baidu.com/s?id=1763082601430681295&wfr=spider&for=pc,最后訪問時(shí)間:2023年4月16日。
[4] 陳永偉:《生成式AI時(shí)代的著作權(quán)之困》,載《經(jīng)濟(jì)觀察報(bào)》2023-04-12 02:01,http://t.10jqka.com.cn/pid_279982808.shtml,最后訪問時(shí)間:2023年05月02日。
作者:高玉光北京市信利(深圳)律師事務(wù)所
編輯:智愿君 校對(duì):智愿君
-
開源技術(shù)
+關(guān)注
關(guān)注
0文章
389瀏覽量
7956 -
OpenHarmony
+關(guān)注
關(guān)注
25文章
3727瀏覽量
16380 -
生成式AI
+關(guān)注
關(guān)注
0文章
506瀏覽量
494
原文標(biāo)題:HIT 16: 生成式AI版權(quán)風(fēng)險(xiǎn)探討
文章出處:【微信號(hào):開源技術(shù)服務(wù)中心,微信公眾號(hào):共熵服務(wù)中心】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論