随着通用人工智能時代的到來,企業資料在數字治理生态體系中的重要性日益凸顯,産業發展産生了企業資料賦權的需要。企業資料權是智能時代孕育的新型知識産權,具有鮮明的時空性與地域性。相比于現有知識産權,企業資料權是一種弱權利,具有相對排他性,需要在證明公開性、有價性、管理性基礎上才可以有限排除他人使用。通用人工智能視野下的企業資料賦權,應當以促進産業發展為根本,建構科學合理、寬嚴相濟的企業資料權體系。其中,資料資源持有權是企業資料權的基礎,加工使用權是企業資料權的核心,流通交易權是企業資料權的價值實作。本文認為通過建構類型化的企業資料權利體系,可以有效激勵資料投資、促進資料流動,推動人類社會加速進入智能時代,并系統分析了企業資料賦權的法理基礎。
一、問題的提出
随着大語言模型ChatGPT(Chat Generative Pre-trained Transformer)的應用,人工智能已經從專用人工智能逐漸邁向通用人工智能(Artificial General Intelligence)。專用人工智能,指從特定的資料集中提取資訊,在特定的場景下運作,用來執行單一任務的人工智能。而通用人工智能指具有與人類相當或更高的認知能力的智能系統,能夠了解、學習、計劃和解決問題,進而在各種應用場景中完成任務。
資料是通用人工智能的基礎。例如ChatGPT和sora就是基于大資料基礎上的深度學習,訓練出的語言模型和文生視訊模型。《中共中央國務院關于建構資料基礎制度更好發揮資料要素作用的意見》(以下簡稱《資料二十條》)根據資料來源和資料特征,将資料區分為公共資料、企業資料和個人資料。企業資料指的是各類市場主體在生産經營活動中采集加工的,不涉及個人資訊和公共利益的資料。在通用人工智能中,供資料模型訓練的資料集以及資料模型形成的資料産品都屬于企業資料。
就企業資料而言,目前大陸主要通過《反不正當競争法》以權益形式予以保護,然而行為規制模式存在權利邊界不清、穩定性不足等問題,難以滿足通用人工智能的産業需求。對是否需要對企業資料賦權以及如何進行賦權,既有研究存在明顯分歧。資料賦權否定論者認為,大陸對于企業資料的保護水準,已經遠超财産權保護規則的保護水準,資料确權隻會增加資料利用的難度,而不會推進資料利用。資料賦權肯定論者對于如何進行資料賦權的觀點也是大相徑庭。多數學者主張以權利模式對資料進行賦權,但對于企業資料權系何種權利,目前主要有三種不同觀點:知識産權法學者主張企業資料與資訊保護類工業産權具有深度的契合性,有必要将企業資料權納入工業産權序列;民法學者認為資料權與知識産權在權益結構、保護期限、保護理念、權利客體等方面均不相同,主張通過借鑒物權經驗,确認和保護資料處理者的持有權、使用權、收益權、處置權等财産權益,并根據不同主體對資料形成的貢獻來源和程度的不同,設定資料原發者擁有資料所有權與資料處理者擁有資料用益權;還有學者主張資料财産權具有财産性、對世性、有限支配和有限排他的基本屬性,是與物權、知識産權相并列的第三類具有對世性的财産權利。權利模式之外,也有學者主張資料保護本質上是建構資料流通利用秩序的一種财産治理範式。關于賦予何種權利,有學者認為可采取資料制作者權和資料使用者權二進制權利結構,其中,資料産品制作者權是資料賦權的核心權利;也有學者按照資料生成的周期建構資料權利,為資料采集、資料加工利用、資料産品交易建構資源持有權、資料加工使用權和資料産品經營權。
由此可見,企業資料作為資料的一種類型,在賦權必要性和權利屬性以及權利内容上面臨着巨大的分歧。目前,大多數學者在讨論企業資料賦權問題時,并未根據人工智能産業發展的特點、資料類型的特征,建構符合企業資料價值的結構性、類型化權利體系。資料财産權理論主張對資料進行财産保護,不利于資料在人工智能産業中的流通使用;資料新權利理論将企業資料視為全新的民事權利,未能充分考慮企業資料的曆史淵源和技術背景,使得對該問題的研究與既有的民法體系難以自洽;資料持有理論強調治理範式,保護的客體仍為資料利益,沒有從根本上明确企業資料的權利範圍和權利内容。
企業資料賦權與科技發展密切相關,目前正是由于人工智能對傳統産業帶來了颠覆性革命,才使得企業資料賦權進入法學研究的視野。鑒于此,本文拟在分析企業資料賦權客觀背景的基礎上,結合企業資料的發展曆史,深入分析企業資料的權利屬性。并根據企業資料的産生周期,從自用權和禁用權角度,對企業資料權涵蓋的資料資源持有權、資料加工使用權、資料産品經營權三項子權利進行類型化展開,最後提出企業資料賦權的結構性權利體系,以期對通用人工智能視野下的企業資料賦權問題作出更為深入的研究和分析。
二、企業資料權是智能時代孕育的新型知識産權
企業資料的本質是資訊,早期的企業資料不具有規模性、創造性和價值性,不為傳統的知識産權所包含。近年來,随着算法、算力和資料存儲能力的發展,人類社會逐漸進入智能時代。層出不窮的大模型使得企業資料呈現爆發狀态,産生日益凸顯的價值。産業發展需要是企業資料賦權的基本需求,企業資料賦權亦需要立足于産業規律和企業資料的屬性特征。
(一)企業資料賦權是通用人工智能時代的客觀需要
1.通用人工智能産生海量資料需要得到法律保護
通用人工智能大模型的學習分為通用智能和專業智能兩階段,前者側重于語言了解、推理能力以及通用知識的學習,後者側重具體任務指令的學習。相比于精于某一領域的專用人工智能,通用人工智能涉及的面更廣,事先收集和人機互動過程中擷取的使用者資料更為多樣,基于自我學習特定算法衍生的資料數量更多。這些企業資料具有使用價值,需要法律予以規制,以防止資料的無序利用。
2.資料的快速疊代決定了資料賦權的時效性
從ChatGPT到sora,大模型對于資料的處理能力不斷加強,可以預見随着通用人工智能時代的到來,資料疊代速度更快。通用人工智能視野之下,企業資料賦權具有鮮明的時效性,一方面要促進資料的有序開發,另一方面又要對企業資料權的保護期限進行限制,促進已經被疊代的資料盡快進入公有領域,實作資料共享共用。
3.從保護知識拓展為保護運用資料的能力
人工智能加速了人類知識發現程序,同時也會帶來知識的貶值。人工智能通過強大的檢索和運算能力,不論是對技術場景的拆分組合,還是對跨領域資料的挖掘加工,都能輕易生成海量的能夠通過實用性審查的專利申請,也使得平庸的作品創作失去意義。通用人工智能時代的到來倒逼人類社會的發展從追求知識進入追求智慧的新階段,人的價值不僅展現在擁有多少知識,更在于擷取資料、加工資料、運用知識的能力。通過完善企業資料治理體系,建立企業資料的法律賦權制度,可以推進資料的擷取、加工和流通,激勵資料在運用中發揮更大的價值。
4.企業資料侵權風險加大
以深度學習為特征的算法模型,本質上是一個端到端的黑箱。在大模型預訓練過程中,片面、虛假的資料會産生錯誤的回報結果,産生資料偏見和算法歧視的風險。随着通用人工智能時代的到來,有必要以企業資料賦權為主線,建構企業資料合規體系,化解企業資料侵權風險,有效促進數字經濟産業的健康有序發展。
(二)企業資料權是新型知識産權
作為科技發展産生的新型權利,企業資料賦權最合适的路徑依然是知識産權。在保護客體上,企業資料與知識産權保護的都是資訊,兩者在創造性上呈現遞增關系。具有一定創造性的資訊可以成為知識産權的客體,創造性較弱的資訊則可能成為企業資料的客體。在發展曆史上,知識産權的保護促進了作品、商标、專利的披露與流通。和知識産權賦權一樣,對企業資料賦權的重要意義在于彰顯合法性,進而為資料後續的加工使用、流通交易進行合法性确認,促進資料的進一步使用。通過對企業資料賦予知識産權,可以平衡相關經營者投資加工資料獲得私益和社會公共利益,進而建構具有中國特色的資料産權制度體系。
1.企業資料權萌芽于知識産權法
美國最高法院1991年審理的“費思特”案件,是版權法關于獨創性認定的裡程碑案件,也是資料保護的萌芽。在該案中,美國最高法院認為号碼簿以客戶姓名的字母順序編排電話号碼等資料,不具有任何版權法所要求的獨創性,因而不被版權法所保護。誠然,不具有獨創性且未經獨特編排的企業資料難以受到版權法的保護。但知識産權法不僅保護具有獨創性的作品或者技術方案,也保護具有商業利益的商業辨別和商業秘密等。
知識産權法是一個不斷擴張的過程,商業實踐的發展促進知識産權法律體系逐漸完善。19世紀中期以前,商業辨別的财産性一直沒有得到承認。而在19世紀後半期,由于商業辨別在商業實踐中的承認和使用,商标法開始成為獨立的法律領域,逐漸納入知識産權法領域。商業秘密本身亦不必然具有創造性,例如經營資訊,更多的是與公有領域的資訊區分開來。雖然商業秘密的保護曆史悠久,但一開始并未作為單獨的知識産權類型寫入巴黎公約。與商業辨別一樣,商業秘密也是經過長期的商業實踐不斷得到認同而單獨立法,并最終納入知識産權法系統。是以,知識産權法本身就是一個随着技術和商業發展不斷擴張的過程。知識産權法不但保護具有創造性的作品和專利技術方案,同樣也保護具有商業利益的商标和反不正當競争法規制的商業秘密、商譽等客體。
企業資料與知識産權法存在密切關聯。在工業時代,以電話号碼簿中客戶電話号碼為代表的企業資料一開始并未得到著作權法的保護,亦未得到其他知識産權法的保護。原因在于,囿于當時的生産力水準,資料的作用未能得到充分利用,資料的價值亦未能得到足夠的重視。雖然企業資料一開始沒有得到著作權法的保護,但從一定程度上展現了企業資料與知識産權存在某種密切的關聯。随着人工智能的發展,使得資料展現出前所未有的價值。随着社會發展的需要,個人資料、企業資料、公共資料承擔着不同功能定位,亦有不同的立法需要。目前,個人資料、公共資料已分别立法,具有市場價值的企業資料完全有可能單獨立法,系統納入知識産權法律體系之中。
2.企業資料權根植于知識産權法
依據現有的法律,企業資料中的一部分已經被知識産權法所覆寫。具有獨特編排的資料可以作為彙編作品受到著作權法保護,未公開的企業資料可以受到商業秘密的保護。企業資料并非想象的那樣是一片全新的法律領域,而是存在于現行的知識産權法之外的有限的空白地帶。
目前,企業資料雖未被賦權,但已經産生了司法保護的需要。國内的企業資料保護主要通過知識産權法律體系中的《反不正當競争法》來保護,例如在大衆點評網、美景案中,均通過大陸《反不正當競争法》第2條一般條款保護。在《反不正當競争法》修改建議稿中,也專門規定了商業資料專條。未來一段時間内,企業資料仍主要以《反不正當競争法》的路徑進行保護。《反不正當競争法》以行為規制模式保護企業資料權益,避免了企業資料财産權可能導緻對資料的絕對支配問題,但《反不正當競争法》具有個案認定、事後規制等問題難以解決。随着通用人工智能時代的到來,智能技術與治理場景深度融合,企業資料在數字治理生态體系中的重要性日益凸顯,企業資料的保護仍應通過單獨立法進行賦權。
值得關注的是,在原《民法總則》的制定過程中,草案第一稿第108條第2款規定,知識産權是指權利人依法就下列客體所享有的權利:“……(8)資料資訊;……”鑒于對資料和網絡虛拟财産的概念範疇、保護範圍、權利屬性、權利和義務内容存在較大争議,草案二審稿将資料和虛拟财産單列一條作出規定,規定“法律對資料、網絡虛拟财産的保護有規定的,依照其規定”,最終通過的《民法總則》保持了這一規定。《民法典》總則編維持了《民法總則》的這一規定。資料分為個人資料、企業資料、公共資料,三者各有側重。個人資料側重資訊保護,公共資料側重資訊公開,企業資料側重流通使用,一概認定為知識産權客體賦予壟斷權利并不科學。企業資料同知識産權一樣,屬于具有資訊結構但沒有外形的“有構無質”之物,因為具有商業利益而受到知識産權法的保護。
(三)企業資料權的權利特征
1.企業資料權具有鮮明的時空性
企業資料權的時效性強、保護期短。人工智能時代,電腦、物聯網傳感器、網絡使用者、大模型等源源不斷地産生資料,資料資訊疊代更新速度快。對于企業資料權賦予過長期限的保護期,可能造成已經失去時效的資料資訊被過度保護,影響了資料的流通使用。是以,相比于其他知識産權,企業資料權的保護期限更短。
2.企業資料權具有地域性特征
企業資料權的地域性展現在權利産生的前提條件方面,企業資料要在國内獲得保護就應當在國内産生或者登記。企業資料權的地域性亦展現在對企業資料的審查管理方面。智能時代,企業資料涵蓋了社會經濟生活的大量資訊,涉及國家安全。是以各國都出台了資料的監管措施,對資料實行分類分級保護制度。對于可能影響國家安全的企業資料,在資料處理、資料傳輸過程中進行安全審查,建構資料安全合規有序跨境流通機制。
3.企業資料權注重保護在先權利
根據國家網際網路資訊辦公室釋出的《生成式人工智能服務管理暫行辦法》,企業資料不得侵害他人依法享有的知識産權和個人資訊。在智能時代,企業資料的很多内容來源于使用者生成的資料,使用者生成的資料含有個人資訊的,企業在收集資料之前應當取得個人同意,加工過程中應當過濾個人隐私。在對資料标準化處理過程中,推動個人資訊的匿名化處理,充分保障隐私權、名譽權、榮譽權等人格權。算法模型的預訓練依靠資料資源,相應的資料資源應當合法取得。目前,各國都出現了資料未經授權用于算法模型的侵權行為。2023年2月,全球最大的圖檔庫公司“Getty images”起訴Midjourney未經許可利用自身作品進行算法模型訓練。
2023年6月,國内也出現了筆神作文訴學而思未經授權使用其資料訓練人工智能大模型的糾紛。
4.企業資料權具有弱權利屬性
企業資料權保護的是企業持有的公開又具有市場價值且采取管理措施的資料集或者資料産品,系對現有知識産權體系的補充保護。本來無法得到知識産權法保護的企業資料,因為人工智能産業的發展而得到賦權。如果賦予企業資料權和知識産權一樣的保護力度,可能會造成對現有權利位階的沖突,最終架空了既有的法律保護體系。是以,符合創造性要求的企業資料應當選擇著作權或者專利權進行保護。相比于現有知識産權,企業資料權是一種弱權利。
5.企業資料權具有弱排他性
在知識産權中,著作權、專利權、商标權屬于強排他性權利,權利一經取得,任何人未經許可不得擅自使用。商業秘密具有弱排他性,需要在行使排他權之前個案認定商業秘密的成立。商業秘密并不具有絕對的排他性,而是符合特定條件下的相對排他性。企業資料權作為一種從權益演化而來的權利,亦具有弱排他性,需要在個案中證明企業資料的公開性、有價性、管理性,在此基礎上才可以排除他人使用。是以,相比于一般的民事權利,企業資料權的權利屬性較弱。
通用人工智能中,企業資料的加工使用成為标準化的流程。資料經過脫敏、清洗、分類、排序、整合而成為資料資源,資料資源經過加工使用成為能夠标準化使用的資料産品,資料産品在流通交易中實作了資料價值。根據資料産生的周期,分别産生了資料資源持有權、資料加工使用權、資料産品經營權,這樣的分類标準與《資料二十條》關于企業資料權利的分類相同。對企業資料的賦權可以知識産權自用權和排他權為視角,對于企業資料的三種權利進行法律化解釋。
三、通用人工智能視野下的資料資源持有權
人工智能時代,海量的企業資料經過分類整合形成了資料資源。企業基于對資料的管理形成了資料資源持有權,資料資源持有權系企業資料權最為常見的表現。随着通用人工智能的加速到來,資料資源主要集中于為大模型提供預訓練功能,與此相對應的資料資源持有權系企業資料權的基礎性權利。
(一)資料資源持有權的内涵
資料資源持有權包含兩方面的内容,即資料資源持有者持有的資料系合法擷取,資料資源持有者基于對資料的合法擷取對資料進行管理控制。合法擷取他人資料既包括對于他人原始資料的擷取,也包括對他人資料要素和資料産品的擷取。管理控制資料指的是企業有權對合法收集的資料進行脫敏、清洗、分類、排序、整合。資料管理是資料加工的前序和準備工作,通過對企業資料實施清洗、分類、排序等管理措施,資料得以轉化為可供生産使用的資料資源。企業基于對資料的擷取和管理而産生資料資源持有權,以此排除他人未經許可使用相關資料。
(二)資料資源持有權的權能
1.禁止他人以非法手段擷取資料
資料持有者有權禁止他人以非法手段擷取資料。禁止他人非法擷取企業資料的防護措施,既包括設定管理措施禁止他人實體擷取企業資料,也包括通過合同約定等方式合理限制他人擷取使用企業資料。禁止他人擷取的資料既包括網際網路平台的個人賬戶、密碼資料,也包括擷取網際網路平台的背景資料等。公開的資料雖然是向公衆無差别提供,但不意味着其他企業可以不受任何限制地擷取和使用,企業可以通過設定通路權限等方式限制他人對資料進行通路、複制、篡改或者破壞。資料持有權人還有權禁止他人複制、篡改或者破壞其管理控制資料,以防止其對資料的管理控制狀态的破壞。
非法擷取他人資料的情形具體有:一是破壞技術措施,以盜竊、電子侵入等方式擷取他人資料。擁有大量資料資源的平台往往會采用特定技術措施防止他人擷取,因技術措施的強度和有效性不同,破壞不同技術的措施也有差異。二是違反雙方約定,超出合同約定範圍或者約定期限擷取他人資料。違反約定的範圍和條件抓取資料,如“新浪微網誌訴脈脈案”涉及的資料抓取行為,違反約定的期限擷取他人資料。被告在許可合同終止後,繼續實施抓取他人資料的行為。三是違反商業道德規範,以誤導等方式擷取他人資料。例如,違反robots協定抓取資料。但在特殊情況下,确實也存在robots協定不當設定的情況,此時被告可以提出抗辯并提供相關證據予以證明。
非法擷取他人資料是侵害企業資料資源持有權的典型行為。例如,在騰訊公司訴珍分奪秒公司侵害商标權及不正當競争糾紛案中,珍分奪秒公司通過使用近似商标、近似軟體名稱及宣傳語等方式誤導微信公衆号平台使用者下載下傳其“公衆号助手”軟體,并通過“公衆号助手”軟體下載下傳過程擷取微信公衆号使用者的賬号、密碼,屬于對微信公衆号賬号、密碼等資料的收集、存儲行為。上述行為可以認定對企業管理的資料進行了非法的擷取和存儲,侵害了企業的資料資源持有權。又如,在北京微播視界有限公司與上海六界資訊技術有限公司、廈門市扒塊腹肌網絡科技有限公司、浙江淘寶網絡有限公司不正當競争糾紛案中,六界公司利用技術手段非法擷取“抖音”平台上抖音使用者直播打賞記錄及主播打賞收益相關資料,并通過自行整理計算後予以公開展示,其行為系非法擷取“抖音”平台持有的資料,侵害了“抖音”平台的資料持有權。
2.禁止複制他人管控的資料并構成實質性替代
非法複制他人資料并構成實質性替代,亦會侵害企業資料持有權。例如,在大衆點評案件中,大衆點評網的使用者點評資訊不一定屬于大衆點評公司,但已成為企業的核心競争資源。大衆點評網對于使用者點評資訊進行清洗,初步排除虛假和非法資訊,同時按照商戶位置和類别,參照評論發表的時間先後順序對使用者評論資料進行排序。通過對資料的清洗、分類、排序,大衆點評網獲得了資料的管理控制權。百度公司的搜尋引擎抓取大衆點評網上的涉案資訊,雖未違反robots協定,但實施了對大衆點評網管控資料的複制行為,造成對大衆點評網管理控制資料的實質性替代,可以視為侵害了大衆點評公司的資料資源持有權。
(三)資料資源持有權的權利特征
1.企業基于對資料資源的整合産生了資料資源持有權
智能時代,萬物皆可數字化,但并非所有的資料都是可以直接使用的資料資源。資料之上的個人資訊需要隐匿,零碎的資料需要進一步收集整合。企業對資料進行收集、脫敏、清洗、分類、排序、整合,使得資料成為可供進一步加工使用的資料資源。在谷歌,至少有四成的工程師天天在處理資料,然後通過資料得到知識,通過知識使得計算機變得更智能。一方面企業在資料的收集和整理過程中投入了時間、财力、管理等方面的資源,另一方面獲得技術(算法)、智力加工的支援,這使得企業資料産生了商業利益,需要通過賦予資料資源持有權來實作權利保護。
資料資源持有權是企業資料的基礎權利。企業對資料資源的加工使用形成了資料加工使用權,對于資料資源的交易或者資料産品的交易形成資料流通經營權,資料加工使用權和資料流通經營權系資料資源持有權的衍生權利。相比于資料加工使用權和資料流通交易權,資料資源持有權着重于保護資料生産要素,系企業資料權的基礎權利。通用人工智能産業中,資料資源的主要作用是為大模型提供預訓練功能,與之相對應的資料資源持有權則應适當展現一定的開放性和包容性,以促進産業的成長發展。
2.資料資源持有權以内容合法為前提
大模型通過對海量資料的預訓練,提煉各種問題的解決方案或者不同類型資料産品的特征,并根據指令生成需要的結果。在海量資料中,難免會夾雜違法不良資訊、個人資訊和受法律保護的知識産權。資料資源持有權存在的前提是資料資源具有合法性,非法的資料難以得到法律的保護。
資料資源應當過濾不良資訊。2022年斯坦福大學釋出人工智能指數報告指出,諸多人工智能的大型語言模型帶有偏見,而這種偏見來源于智能模型的基礎資料,它反映了人類社會的系統性偏見或資料篩選人員的偏見。為保證資料資源的合法性,在資料收集過程中可以通過采取關鍵詞、分類模型等方式,對語料中的不良資訊進行過濾清洗。
資料資源應當保護個人資訊。網絡使用者在使用模型産品過程中會留下大量的資料,這些資料能夠讓通用人工智能為我們提供更加個性化的服務。然而,如果這些資料被濫用或洩露,将會給我們帶來巨大的安全隐患。資料資源持有權得以存在的前提是個人資訊收集的合法化,以及個人隐私的匿名化。倘若資料資源的擷取未得到個人資訊主體的同意,抑或資料在清洗過程中并未進行個人隐私的匿名化,未删除具體的生物資訊,則資料資源本身不具有合法性,也難以産生法律可保護的利益。
資料資源應當保護知識産權。無論是開源資料、自采資料、商業資料、使用者輸入資料,企業在資料擷取使用過程中都應當保護在先的知識産權。企業在資料輸入時應善盡注意義務,對資料是否侵害著作權、商标權、專利權、商業秘密等知識産權進行識别審查,防止在後續資料的加工使用過程中知識産權的違法複制和使用行為發生。同時對資料資源中涉及知識産權部分的摘要資訊進行公開,在投訴管道中支援第三方就相關的知識産權情況進行查詢。
3.資料資源持有權有助于實作信賴利益保護
大規模的資料訓練是人工智能模型生成準确結果的基礎,在海量的訓練素材中可能包含侵害個人資訊、知識産權或者違規資訊的存在。通過對資料的收集、清洗、整理後,産生了資料資源持有權,但難免仍有違法違規的不良資訊存在。對大規模的資料集進行人工審查不具有可操作性,通過設立資料資源持有權,客觀上阻斷了資料加工使用權、資料流通交易權與在先權利的關系。如果資料資源産生侵權,相應責任由資料資源持有者承擔,客觀上保護了後續環節資料加工使用者、資料流通交易者的信賴利益,也降低了資料加工使用的門檻。通過設立資料資源持有權,可以有效提升資料的複用價值。
四、通用人工智能視野下的資料加工使用權
人工智能技術依靠視覺技術、語音技術、自然語言了解和規劃決策等系統實作人機互動,人機互動的過程亦是資料加工使用的過程。在生成式人工智能中,大模型産出的資料産品需要通過加工使用權進行保護,在未來,通用人工智能産生的資料産品亦需要通過加工使用權加以調整。是以,資料加工使用權是企業資料權的核心,也是通用人工智能産業需要重點保護的對象。
(一)資料加工使用權的内涵
企業資料加工使用權包含加工生産和使用兩個方面。資料加工系企業根據使用者需求,通過大模型對資料進行分析處理的過程。加工既可以是對資料要素的分析處理,也可以是對資料産品的再加工。通過資料加工,形成了新的資料産品。在資料使用環節,企業将加工生産的資料産品應用于具體場景,以解決特定需求,實作企業的數字化轉型。
(二)資料加工使用權的權能
1.禁止他人未經許可擅自加工資料資源
通過賦予企業資料加工使用權,企業可以禁止第三人未經許可擅自生産加工、使用資料。例如,在北京奧蒂思品牌管理咨詢有限公司與北京車質網資訊技術有限公司、趙某不正當競争糾紛案件中,車質網公司收集海量用于對各品牌汽車的投訴資訊後,進行逐一稽核、分析、整理、修改,并通過專業編輯最終按照統一格式在網站前端展示。這一過程并非簡單的資料收集,而是對消費者投訴資訊進行了特定格式和内容的加工整理。奧蒂思公司作為同業競争者,用複制和搬運手段将他人積累的投訴資訊據為己有,并公然作為自身經營資源予以展示和使用,侵害了車質網公司基于對資料加工獲得的資料加工使用權。
2.禁止他人未經許可擅自使用資料産品
資料使用中存在多種應用場景,企業資料權人有權禁止他人未經許可擅自将資料産品應用于具體場景。在目前的生成式人工智能中,資料輸入和文本整理産品可以應用于辦公場景,有效提升工作效率;資料分析和決策支援産品可以應用于企業管理,通過識别資料中的模型和趨勢,輔助企業決策;自然語言處理産品可以應用于客戶服務,通過問題回答和溝通交流提升客戶體驗。随着通用人工智能的發展,資料産品可以運用于學習、工作、生産、生活的任意場景,未經許可的第三人則不得擅自使用資料産品進行場景應用。
(三)資料加工使用權的權利特征
1.加工使用權是企業資料權的核心
資料加工是資料利用最為核心的環節,企業基于對資料加工的實質性投資産生資料權利。經過加工的資料可以成為分享、轉讓的客體,但并非所有的加工資料都具有交換價值,隻有真正意義上實作一般意義上且公認的“價值增值”的資料才能成為客體。資料經過加工産生了兩類資料産品。一種是模型産品,例如文生語言智能模型ChatGPT、文生視訊智能模型Sora。另一種是知識産品,例如分析報告或解決方案等。企業資料作為一種生産要素,經過加工産生了新的資料。是以,在整個資料利用體系中,資料加工權處于核心地位。通過賦予資料加工使用權,使得企業加工資料的過程得到法律的保障,加工的産品得以順利流通,不斷促進數字經濟的發展。
資料使用是資料增值的重要途徑。資料作為無體物的一種,不會因他人的使用而減少其資料本身的價值,反而因無數人的不斷使用使得資料産生新的衍生價值與附加價值。在尊重資料來源主體法定在先權益的前提下,資料持有人可以根據自己的商業生産經營需要使用資料,包括利用資料分析生産經營規律、訓練人工智能模型、加工資料産品等諸多使用方式。資料使用是資料加工的目的,資料使用權也是資料賦權的重要權能。
2.資料污染和算法歧視導緻資料加工使用權被侵害
資料要素經過算法加工産生了資料産品,資料産品的品質很大程度上取決于訓練資料的品質和算法的合規程度。智能時代,大資料的邏輯已經從因果關系轉變為強相關關系,客觀上導緻了中間過程的算法黑箱。基于自主智能、資料依賴、算法黑箱等特征,企業資料在應用衍生、資料安全和隐私保護等方面将面臨嚴峻的挑戰。資料污染及算法歧視都可能侵害資料加工權,降低資料的使用價值。是以,在源頭上要通過提高資料品質,力促算法合規。
資料污染侵害了資料加工使用權。人工智能産業中,資料加工包含資料學習、訓練過程和結果輸出三個階段,資料學習的本質是對資料要素的複制。人工智能通過學習語言表達模式,生成自然流暢的對話内容;基于自我學習能力,改進互動經驗表現;利用有監督微調方法,通過在高品質标注資料上微調基礎語言模型,使用帶有人類回報的語言模型進行強化學習,使模型更安全。高品質的資料資源是人工智能加工使用的基礎。目前,人工智能技術的訓練資料多來自網際網路上的公開資料。這些資料的品質參差不齊,時常隐藏着虛假資訊和帶有價值偏向的政治議題和道德立場,導緻人工智能生成内容存在潛在的侵權風險。通用人工智能階段,要想避免企業加工使用權被侵害,就要降低此類資料的風險,通過資料标注、資料分級和資料交易,不斷提升基礎資料的品質。
算法歧視也可能侵害資料加工使用權。資料加工使用權是基于對資料合法加工使用而産生的權利,資料因為加工使用而侵害了使用者的權利,其過程亦侵害了資料加工使用權。算法系人機互動的決策,包含代碼設定、資料運算和自動化決策等一整套機制。通用人工智能算法專注于解決如何模拟、再現智能的技術問題,在決策過程中,也可能會因為資料分析導緻對特定群體産生不公正的對待。例如,上海某商務有限公司就曾在酒店預訂中,利用算法對客戶進行價格歧視,導緻客戶通過應用預訂的酒店房價遠高于門市價。4美國亦有航空公司曾利用個人隐私大發其财,當航空公司發現某個機票的詢票者最近必須旅行,而且在過去對票價不是很敏感時,它給出的報價就會比其他人的高很多。因為算法歧視的存在,資料在加工使用中侵害了網絡使用者的權利,亦侵害了企業資料的加工使用權。
五、通用人工智能視野下的資料流通交易權
通用人工智能時代,模型産品的生成和優化離不開資料訓練,資料産品的價值亦不斷得到重視。無論是資料資源還是資料産品,都因為産業的發展而具有了交易價值。通過賦予資料流通交易權,既可以促進資料資源和資料産品的市場化流通,又可以實作資料投資回報,促進資料産業發展。
(一)資料流通交易權的内涵
企業資料的流通交易權指的是企業有權将合法持有的資料進行轉讓、許可他人使用,以及轉化為資料資産。資料的無體性和可複制性決定了資料的流通交易權有别于傳統物權,資料的流通交易可以最大化發揮資料的價值,實作資料權利的充分利用。企業資料流通交易權存在的前提是企業對資料的合法持有,或者基于流通、交易等合同約定合法取得資料産品。根據已經釋出的資料流通交易地方性法規,内容合規、真實可用,具有明确應用場景或使用案例,能夠提供測試資料,具有持續供給能力或資料更新能力,可以定價的資料産品可以成為流通交易的資料。
流通交易是企業資料價值實作的重要管道,通過賦權實作法律保障有助于推動企業資料的價值實作,促進資料投資得到回報,強化基于資料價值創造和價值實作的激勵導向。企業資料的流通交易存在多種方式:一是企業資料的轉讓。企業資料轉讓後,雖然實作資料的市場化流通,但也喪失對産品享有的使用權。二是企業資料的許可。許可他人使用資料産品是企業資料流通交易最常見的模式,企業資料權人可以通過許可使用的方式獲得資料産品收益,同時通過資料許可實作資料的流通複用。三是企業資料的融資擔保。擔保是企業資料融資的重要方式,通過在資料之上設立擔保,實作資料價值的市場評估。四是企業資料的投資入股。企業資料作為生産要素,與土地、資金一樣具有投資入股的價值,将企業資料用于投資入股,有助于實作資料的多元化資産配置。
(二)資料流通交易權的權能
1.禁止他人未經許可交易資料
企業資料權人有權禁止被許可人再許可,超越許可條件、許可範圍和許可期限進行資料交易。如同其他的知識産權在流通交易過程中需要遵守在先的約定,企業資料的許可和交易同樣需要符合在先的合同約定。在2023年11月歐盟議會通過的《資料法案》中,第14條亦規定了資料被許可人一般情況下不得為商業或者非商業目的向第三人提供資料産品。
禁止他人未經許可交易資料亦存在例外情形。例如,為保護特定利益,在確定優先保護的利益與資料持有人是以遭受的損失、資料安全風險等符合比例原則的前提下,可以未經權利人許可交易資料;又如,為了促進經濟發展和創新、建設數字政府和智慧城市、增加社會福利等公共利益,可以未經權利人許可交易資料。
2.禁止不合規的資料跨境流通
企業在行使資料流通交易權時,對在境内收集産生涉及個人資訊的大資料或者重要資料,應當在合規申報的前提下進行資料跨境流動。就通用人工智能模型而言,其在模型訓練時的資料輸入倘若涉及個人資訊,或者産生的資料産品依然含有個人資訊,需要進行合規審查後再進行資料跨境流通。當然,資料的跨境流通也有例外情形,如僅涉及學術合作、國際貿易的資料出境,不是境内收集的資料,以及特定情形下的個人合理有限使用資料,并不需要進行跨境審查。
(三)資料流通交易權的權利特征
1.資料許可中的公平、合理、無歧視原則
相比于專用人工智能,通用人工智能對于基礎資料要素的需求更大,産生的資料産品也更為集中,資料持有企業在資料流通交易中應做到公平、合理、無歧視和透明,防止資料壟斷行為的發生。企業資料流通交易的管道是多元的,既可以進行場内交易,也可以進行場外交易,符合資料合規和資料安全的企業資料可以進一步實作跨境流通和跨境交易。通過打造可信的資料流通交易體系,增強資料的可用、可信、可流通、可追溯水準,有序發展資料跨境流通和交易,實作資料共享互利。
2.客觀合理認定資料價值
企業資料的定價應當建立在對資料品質、資料成本、産品層次和買方異質性等多元度的考量基礎,通過推動市場主體不斷嘗試符合商業需求和經濟規律的資料定價模式,進一步釋放資料生産要素的活力。在現有的裁判中,多以法定賠償或者裁量性賠償來計算企業資料的價值。其原因在于企業資料的實際損失或者違法獲利難以充分舉證,由于資料交易剛剛興起,也缺少可供參照的資料交易記錄。随着資料交易市場的成熟完善,企業資料在流通交易過程中可以參考許可使用費定價,同時也可以參照資料收集、存儲、挖掘、加工及傳遞的成本,資料服務接收方可能獲得的經濟利益等方式對企業資料進行價值評估。
3.強化基于資料價值的激勵導向
在資料流通交易權的實作過程中,收益配置設定決定了資料的優化配置。在收益配置設定時,一方面要處理好企業資料和個人資料之間的關系,若采集的企業資料涉及個人資訊,應當以合理形式對個人進行補償。另一方面,要根據資料加工的環節,按照“誰投入、誰貢獻、誰受益”原則,充分考慮企業在資料持有、加工使用等環節投入的勞動和資金,保障資料持有者和加工使用者獲得收益的權利。
六、建構科學合理的企業資料權利體系
正是由于人工智能技術的興起,使得企業資料的價值不斷被重視,産生了企業資料賦權的保護需求。企業資料權體系的建構應當以促進産業發展為根本,建構科學合理、寬嚴相濟的企業資料權體系。企業資料權利體系的建構應當以促進人工智能産業發展、實作企業資料流通複用為價值導向。
(一)企業資料權的建構要平衡公私利益
企業資料賦權為資料産品的商業化提供前瞻性的制度安排,促進資料的流通與保護。既要確定企業資料權中的資料資源持有權、資料加工使用權、資料流通交易權在不同的資料流通環節産生有效的排他性,又要進行必要的權利限制,保障其他資料産業者的使用權益。在時空限制方面,賦予企業資料資源持有權、資料加工使用權、資料流通交易權差異化的權利期限,又要防止權利期限過長影響資料的流通複用。在合理使用方面,将科教文衛的小規模使用、公共部門和科研目的的資料加工使用行為納入企業資料的合理使用情形。在法定許可方面,當發生重大疫情或者涉及公共利益時,可以要求企業公開人工智能生成資料協助公用管理。同時,通過建立必要資料共享制度,確定關鍵領域中必要資料的開放。
(二)企業資料權的建構要優化權利架構
以資料資源持有權、資料加工使用權、資料流通交易權為主體的企業資料權,本質上是以資料資源和資料産品為區分客體形成的權利體系。企業通過對資料資源的管理而形成資料資源持有權,資料資源經過加工使用形成資料産品,資料産品形成過程中産生的民事法律關系構成了資料加工使用權的權利客體,資料産品的經營又産生了企業資料流通交易權的需要。企業對大資料進行脫敏、清洗、分類、排序、整合而形成資料資源,在這個過程中并不産生新的資料,這是資料資源持有權與資料加工使用權在客體上的明顯差別。在企業資料權體系中,資料資源持有權是基礎權利,資料加工使用權是核心權利,資料流通交易權是價值實作。在企業資料的三種權利之中,最為重要的是資料的加工使用權,資料加工使用權的建構對于保護人工智能生成的資料産品至關重要。建構企業資料權,本質上是以資料加工使用權為主體、資料資源持有權和資料流通交易權為“兩翼”的權利體系。
(三)企業資料權的建構要統籌權利關系
企業資料和個人資料、公共資料定位不同,對應的權利體系亦不相同。但企業資料權和個人資料、公共資料并非完全獨立,通用人工智能預訓練的資料很多來自個人資料,大模型形成的資料産品經過一段時間保護後終将流向社會,成為公共資料。既要關注資料資源持有權和個人資料權利存在的交集,在資料資源持有權的行使過程中保護個人資訊、補償個人利益。又要厘清資料加工使用權、流通交易權和公共資料權利的關系,合理考慮企業資料的時效性,形成動态的企業資料權利評估體系。
結語
目前,全球開始了新一輪的技術革命,其核心是将智能問題變為資料問題。如果說資本和蒸汽機是大航海時代以來全球近代化的推動力,那麼資料就是智能時代技術革命的核心動力。資料和算法是通用人工智能的兩大基石,資料尤其是企業資料,對于通用人工智能的發展至關重要。
企業資料權作為新型知識産權,本質上屬于保護期限較短的弱權利。通用人工智能視野下的企業資料賦權,需要結合智能時代資料體量龐大、來源廣泛、疊代快速的特征,立足《資料二十條》資料資源持有權、資料加工使用權、資料流通交易權的三權分置架構,進行法律化的解釋。通過對企業資料賦予有限的排他權,可以有效激勵資料投資、促進資料流動。誠如商标權的出現推動了商品品質的提升、促進商業經營的繁榮,企業資料的賦權亦将推動通用人工智能的發展,加速智能時代的到來。