>政務信息 | >政務公開 | >政策文件及解讀 | >本機關其他政策文件 |
索引號: | 002482410/2025-679128 | 主題分類: | 其他 |
發布機構: | 省市場監管局(省知識產權局) | 成文日期: | 2025-09-14 |
浙江省知識產權局關于印發《浙江省人工智能領域數據知識產權登記申請指引(2025)》的通知
發布日期:
2025-
09-
18
18:
24
瀏覽次數:(
)
各市、縣(市、區)知識產權局,各有關單位: 為貫徹落實省委十五屆七次全會精神,進一步放大數據知識產權改革優勢,推動數據知識產權與“人工智能+”行動融合、賦能人工智能產業發展,省局研究制定了《浙江省人工智能領域數據知識產權登記申請指引(2025)》,現予印發,請參照執行。 浙江省知識產權局 2025年9月14日 浙江省人工智能領域數據知識產權登記 為貫徹落實省委十五屆七次全會精神,進一步深化數據知識產權改革,推動人工智能領域數據知識產權登記保護,提高人工智能數據供給質量,助力打造人工智能創新發展高地,根據《浙江省知識產權保護和促進條例》《浙江省優化營商環境條例》等有關規定,制定本指引。 一、適用范圍 本指引所指人工智能領域數據知識產權登記對象包括: (一)對象一。基于人工智能大模型,通過預訓練等方式形成適配專項能力或特定任務解決能力要求,所形成的算法、參數、模型等數據處理規則和數據集合,符合數據知識產權登記要件的; (二)對象二。基于人工智能相關技術,通過智能體、腦機接口、具身智能、生物啟發等應用創新技術,所形成的算法、參數、模型等數據處理規則和數據集合,符合數據知識產權登記要件的。 二、登記前存證公證 (三)xls、csv等表格文件格式的數據。數據為結構化數據,存證時申請人應根據數據結構規模,列舉數據字段名稱、并輔以示例。數據集合字段較為復雜的,應說明字段間的關聯關系。數據規模以“條”為單位進行記錄。 (四)非表格文件格式的數據。數據可以為結構化或非結構化數據,存證時申請人應清楚描述數據結構并輔以示例。數據規模以“KB”“MB”“GB”“TB”等為單位進行記錄。數據結構的描述主要包括: 1.數據形態。如文本、圖像、語音、視頻等; 2.基礎元數據。如存儲格式、數據量、關鍵指標、讀取方式等; 3.主關鍵字段等。 (五)多模態異構數據組合。存證時申請人應根據數據存證要求進行操作,同時清楚描述各類數據結構,并記錄數據規模。 涉及不同數據格式、數據規模和動態數據集合(過程數據)的,數據結構描述信息應能夠準確反映數據集合的核心特征。 申請人也可以對人工智能領域的數據進行公證存證,以公證書作為數據存證公證的內容提交數據知識產權登記申請。 三、登記申請 (六)申請主體。申請登記人工智能領域數據知識產權的數據處理者包括但不限于:數據采集方、加工處理方,以及在數據處理全流程中投入技術資源或智力勞動的模型開發者、服務提供者等。 (七)登記申請相關業務平臺。申請登記人工智能領域數據知識產權,應通過登記申請相關業務平臺如實填寫登記申請表并提供必要的證明文件。申請人可以登錄數據知識產權一體化服務平臺(數知通)提交人工智能領域數據知識產權登記申請。 (八)與“數知通”數據知識產權一體化服務平臺貫通的相關平臺。數據知識產權一體化服務平臺現已與科學數據銀行、中國科學院科學數據總中心知識產權登記服務平臺、浙江省財政廳數據資源治理實驗平臺、阿里云平臺等實現互聯互通,并作為中國科學院計算機網絡信息中心科技資源標識服務平臺節點單位對外提供科技資源標識賦碼服務。 (九)登記申請表主要內容。登記申請表主要包含以下內容: 1.數據知識產權名稱。名稱格式為“應用場景+數據”。 例1:某科研機構申請的主要用于地學領域大語言模型訓練的數據知識產權名稱為“多語言、高精度的地學大模型訓練語料數據”。 例2:某企業申請的主要用于AI大模型領域中代碼生成大模型訓練的數據知識產權名稱為“代碼生成大模型訓練用代碼編程題算法數據”。 例3:某企業申請的能有效縮小CCTV探測范圍,提高CCTV探測工作效率的數據知識產權名稱為“降低CCTV探測成本的管道淤積負荷預測大模型分析數據”。(注:?CCTV探測(Closed Circuit Television Detection)?是一種利用閉路電視技術對地下管道進行檢測的方法)。 2.所屬行業。按照國民經濟行業分類,選擇數據知識產權所屬行業,如“信息傳輸、軟件和信息技術服務業”“科學研究和技術服務業”等。 3.應用場景。說明與人工智能領域相關的數據知識產權適用的條件、范圍、對象,清楚反映數據應用所能解決的主要問題,包括已有場景和預期場景。 例4:某企業申請的名稱為“低空經濟軌道保護巡檢數據”的數據知識產權,應用場景為:通過無人機結合AI算法針對軌道沿線的工程車輛、施工人員安全帽、煙火識別以及軌道人員入侵檢測等業務場景,判斷工程車輛是否正常、人員是否佩戴安全帽、是否發生煙火及是否發生人員入侵等狀態,可以實現軌道區域內的狀態預警與報警,減少人工巡檢的風險并降低運營維護成本。 例5:某企業申請的名稱為“醫療健康病癥篩查數據”的數據知識產權,應用場景為:通過對心理診療記錄數據的采集和處理,將標注過的數據轉化為病癥篩查模型的高質量、高標注準確性的訓練集。訓練好的病癥篩查模型能夠準確識別抑郁癥、焦慮癥等病癥并提供篩查結果,并經過超參數調優和模型優化以提升其準確性和魯棒性,可滿足快速心理篩查、心理健康管理等場景的需求,在心理健康領域有較高的應用價值,廣泛應用于社交媒體監控、心理健康熱線、在線心理咨詢、學校心理健康管理等多個場景,輔助心理健康專業人士進行干預和治療。 4.數據來源。說明數據類型屬于個人數據、企業數據或公共數據。注明數據來源屬于自行產生、協議獲得、公開收集、公共數據授權、多來源或其他來源。 (1)數據來源為自行產生,需確保數據采集的合法合規,要嚴格保證數據采集過程符合《數據安全法》《個人信息保護法》等相關法律法規規定,必要時需提供相關采集能力、采集方式等證明材料(如說明數據采集的具體方法、工具和技術手段以及數據采集過程中的質量控制措施等); 例6:某公司申請的名稱為“某省網格化機會挖掘數據”的數據知識產權,數據來源為自行產生(企業數據)。 (2)數據來源為協議獲得,若數據處理者非共同申請人,需提供相關協議進行證明,協議中可以約定數據使用范圍、期限、數據權益或數據知識產權權屬等相關事宜; 例7:某公司申請的名稱為“醫學影像教學病例題庫數據”的數據知識產權,數據類型為企業數據,數據來源為協議獲得,提交申請時上傳了數據轉讓協議等相關授權材料。 (3)數據來源為公開收集,一般基于與人工智能相關的公開數據集、開源社區、競賽平臺等公開渠道獲得,可以采取以下方式處理: 1)對于能夠明確說明采集渠道的,需提供數據集實際權益人的數據使用許可證(如CC協議、Apache License等)作為授權證明。 例8:某單位申請的名稱為“大規模、多模態、多任務的天基遙感大模型指令微調數據”的數據知識產權,數據類型為企業數據,數據來源為公開收集,提交申請時上傳列明數據集持有方的數據使用許可證等材料。 2)對于合法利用公開數據進行處理生成的數據集合,需在應用場景等內容中進行公開聲明。 數據知識產權審查員應重點審查數據來源合法合規性,對于申請人提供的數據使用許可證、爬蟲協議、網站鏈接、公開聲明等材料,核實驗證其內容是否與采集渠道數據使用條款相符。 (4)數據來源為公共數據授權,應當提供公共數據開放利用協議或授權運營協議等可以表明數據合法來源的證明材料; 例9:某公司申請的名稱為“醫療健康AI模型心電分析訓練數據”的數據知識產權,數據類型為公共數據,數據來源為公共數據授權,申請時提交了公共數據授權運營協議等相關材料。 (5)數據來源為多來源,需明確數據來源的具體情況,并提交各數據來源對應的相關證明材料。 5.結構規模。說明數據知識產權的數據結構(數據字段名稱、格式)、數據結構的描述、數據規模等內容。目前對于數據規模原則上要求達到500條及以上,或者50MB及以上。數據規模少于500條或50MB的,省數據知識產權登記中心可以要求申請人補充數據稀缺性的說明文件。 根據《人工智能生成合成內容標識辦法》等規定,對于涉及人工智能技術生成、合成的文本、圖片、音頻、視頻、虛擬場景等信息的,應在數據結構對生成合成內容添加顯示標識或在文件元數據中添加隱式標識。數據知識產權審查員應當核驗其生成合成內容標識相關材料。 例10:陳某申請的名稱為“面向某省旅游大模型的知識注入數據集”的數據知識產權,數據規模為:共計81萬余組三元組,涉及3萬余個實體和10余種關系類型(具體數字編寫時已進行處理);數據結構如表2-1所示。因數據結構中數據字段表征模糊、數據規模錯誤以及數據知識產權名稱錯誤等原因,數據知識產權審查員發出不予登記通知書。 表2-1 例10數據結構
例11:某企業申請的名稱為“圖像生成AI定制平臺線上推廣ROI分析數據”的數據知識產權,數據規模為650條;數據結構顯示包含“策略優化結論”在內的11個字段,數據知識產權審查員進行審查后,認為符合數據知識產權登記要件,審查予以通過。 6.更新頻次。說明數據或部分數據、部分數據單元的更新頻率、更新期限,如“每日更新”“每月更新”等。 基于數據的動態變化特性,申請人可以從已存證公證的數據及發展趨勢兩個角度闡述更新頻次,也可對更新時間的不確定性或依據需求更新作出說明。對于有明確的數據失效時間或不涉及數據更新的,也應當作出說明。 7.算法規則簡要說明。簡要說明數據處理過程中算法模型構建、處理規則等情況。算法規則簡要說明要與數據結構、應用場景所解決的主要問題等相對應,清楚表述處理相關數據形成數據知識產權的過程。 對于使用支持向量機、決策樹、貝葉斯網絡、神經網絡等算法,應說明所用算法在業內公開發表的中英文標準名稱及關鍵結構參數,如還涉及特定處理規則、策略的一并說明。 對于涉及大模型等生成式人工智能處理的數據集合,應明確訓練數據來源、模型名稱、特征工程處理及參數調優過程記錄等,以證明其與通用模型存在顯著差異性。若僅直接使用模型生成數據,不滿足數據知識產權要件的,一般不予登記。 根據《生成式人工智能服務管理暫行辦法》《互聯網信息服務算法推薦管理規定》等規定,對于涉及具有輿論屬性或者社會動員能力的生成式人工智能服務或深度合成服務的,申請人應就相關備案情況進行說明,注明模型名稱、備案號或上線編號等信息。 數據知識產權審查員可根據審查需要,重點核實數據來源、模型建模或相關技術說明是否清晰,以及對于不同領域的數據處理是否符合其特定領域安全定級標準等。必要時數據知識產權審查員可以進行電話溝通和實地審查。 例12:某企業申請的名稱為“某市包裝企業管道蒸汽用量智慧管控數據”的數據知識產權,算法規則簡要說明中提到的“神經網絡模型”的主要描述為: 構建神經網絡模型,步驟1:采用多層感知機(MLP)結構,包括一個輸入層、兩個隱藏層和一個輸出層。輸入層節點數為9,分別對應時間、總累積質量、總累積熱量、瞬時流量、瞬時熱量、瞬時溫度、瞬時壓力、密度、輸入電流。兩個隱藏層分別有64個和32個節點,激活函數采用ReLU。輸出層節點數為1,對應預測的蒸汽用量。 步驟2:選擇損失函數和優化算法。使用均方誤差(MSE)作為損失函數,優化算法選擇Adam,學習率設置為0.001。 步驟3:將數據集劃分為訓練集、驗證集和測試集,比例為7:2:1。使用訓練集對神經網絡進行訓練,設置訓練輪數為100輪,批次大小為32。在訓練過程中,實時監控驗證集的損失,當驗證集損失連續10輪沒有下降時,提前停止訓練,防止過擬合。 步驟4:對模型進行超參數調整,嘗試不同的隱藏層節點數、學習率和批次大小等參數,找到最佳的模型性能。 步驟5:神經網絡模型輸出預測蒸汽流量值和最高臨界值為17.12t/h,當預測蒸汽流量值>17.12th,管道狀態顯示“管道異常”,當0≤預測蒸汽流量值≤17.12t/h,顯示“管道正常”。 8.存證公證情況。根據存證內容、公證文書相關信息自動生成或填寫,對已存證的數據說明存證途徑、存證編號、哈希算法、哈希值等,對公證存證的數據說明公證機構、公證書文號等,并提供公證文書的復印件或掃描件作為附件,必要時數據知識產權審查員可以聯系申請人查閱公證書正本。如寫明存證平臺為“浙江省知識產權區塊鏈公共存證平臺”、數據存證編號為“CZ20240221XXXXXX”、哈希算法為“SHA-256”、并注明哈希值。 9.其他需要說明的情況。申請人對數據的合規性及申請信息的真實性作出承諾,并從已存證公證的數據中選取樣本數據,作為登記審核的樣例數據。樣例數據要符合登記申請表中對數據結構的描述,xls、csv等表格文件格式以外的數據,可以數據結構的描述代替樣例數據。 申請人可以對所申請登記數據知識產權的主要貢獻人員,登記后的交易、許可、融資等轉化運用的意向等事項的說明。數據知識產權一體化服務平臺將根據申請人轉化運用意向推送服務信息、提供增值服務。 申請人還可對其他必要信息進行說明: (1)申請人認為其登記申請內容涉及核心算法敏感參數,可作出說明并申請相關內容不對外公開; (2)針對個人數據、公共數據以及金融等特定領域的數據處理,需補充說明數據合規情況,申請人可提供倫理審查證明、合法數據授權證明、基準模型測試及性能報告等材料進行佐證。 四、集合申請 (十)集合申請的適用。為便利登記申請,提高審查效率,根據人工智能領域數據創新特點,在單個數據知識產權申請基礎上開設集合申請通道。集合申請主要適用于以下幾個方面: 1.同一個數據知識產權構思方案下,多個登記申請具有關聯性的且具有相對獨立的實用價值的數據結構或數據結構的描述,不同登記申請間既相互具有關聯性且具有獨立存在的價值,算法規則基于同一個思路的。 2.同一個數據知識產權構思方案由于數據采集地域、型號、技術領域等不同,放在同一個登記申請中有利于數據關聯利用,算法規則基本相同的。 3.數據知識產權登記申請基于同一個數據存證公證結果,集合申請有利于節儉申請手續,算法規則有一定差異的。 4.源于同一個源數據,初步處理和深加工處理的數據集合分別有不同實用價值,算法規則有相互關聯度的。 (十一)集合申請的提出。符合人工智能領域數據知識產權集合申請要求的,申請人可以通過數據知識產權一體化服務平臺、省數據知識產權登記中心電話(0571-87356595)等提出需求、預約申請。 (十二)集合申請服務。為便利企業申請、提高登記效率,省數據知識產權登記中心推出集合申請點對點服務機制,依申請為申請人提供實地走訪、申請指導和“審查前置”等服務。 五、登記審查 (十三)部門協同。省知識產權局將會同省經信廳、省財政廳、省數據局、浙江金融監管局等部門,加大對人工智能領域數據知識產權資產化、市場化、價值化推廣力度。根據涉人工智能領域數據知識產權特點,完善登記審查規則,進一步提高人工智能領域數據知識產權登記質量。 (十四)數據內容的校驗。省數據知識產權登記中心加強對人工智能領域xls、csv等格式的數據存證進行內容校驗,包括但不限于:無效字段檢測驗證、樣例數據抽樣核查等。校驗結果將作為數據規范性檢測、數據質量、數據知識產權價值度等評價內容的參考依據。 (十五)必要的實地核驗。省數據知識產權登記中心根據數據存儲規模大小、數據存證公證情況、登記申請信息等,對人工智能領域非xls、csv等格式的數據進行必要的實地核實或驗證。 附件:數據知識產權相關平臺鏈接 附件 數據知識產權相關平臺鏈接 1.“數知通”數據知識產權一體化服務平臺 https://zscqyjs.www.wxlszy.cn/dip/official/home 2.科學數據銀行 3.中國科學院科學數據總中心知識產權登記服務平臺 4.浙江省財政廳數據資源治理實驗平臺 https://dataexp.orginone.cn/#/auth 5.阿里云平臺 |
||||||||||||
附件:浙江省知識產權局關于印發《浙江省人工智能領域數據知識產權登記申請指引(2025)》的通知 |