以詞元為抓手健全數(shù)據(jù)產(chǎn)權(quán)制度
【觀察與思考】
“十五五”規(guī)劃綱要提出,建立健全數(shù)據(jù)產(chǎn)權(quán)、流通利用、收益分配、安全治理等數(shù)據(jù)要素基礎(chǔ)制度。然而,受制于數(shù)據(jù)的多主體共創(chuàng)、非標(biāo)準(zhǔn)化等內(nèi)在屬性,數(shù)據(jù)確權(quán)、流轉(zhuǎn)、分配、監(jiān)管等難題交織并存,大量優(yōu)質(zhì)數(shù)據(jù)資源難以轉(zhuǎn)化為市場化生產(chǎn)要素,制約了數(shù)字經(jīng)濟(jì)的提質(zhì)增效。今年3月,國家數(shù)據(jù)局正式將人工智能領(lǐng)域的Token定名為“詞元”,將其界定為大模型對原始數(shù)據(jù)語義拆解、編碼折算后形成的最小標(biāo)準(zhǔn)化價值單元,這為數(shù)據(jù)產(chǎn)權(quán)制度走向精細(xì)化治理、培育智能經(jīng)濟(jì)新形態(tài)提供了新的實(shí)踐路徑。
數(shù)據(jù)產(chǎn)權(quán)制度建設(shè)面臨的現(xiàn)實(shí)挑戰(zhàn)
產(chǎn)權(quán)制度是數(shù)據(jù)要素市場化配置的核心基石。《中共中央、國務(wù)院關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》(簡稱“數(shù)據(jù)二十條”)確立了我國數(shù)據(jù)產(chǎn)權(quán)的“三權(quán)分置”框架,明確了數(shù)據(jù)資源持有權(quán)、數(shù)據(jù)加工使用權(quán)、數(shù)據(jù)產(chǎn)品經(jīng)營權(quán)三類權(quán)能。區(qū)別于傳統(tǒng)實(shí)物要素,數(shù)據(jù)要素具備非競爭性、無限可復(fù)制性、多主體共創(chuàng)性、價值場景依附性等特征,導(dǎo)致在數(shù)據(jù)治理實(shí)踐中難以直接套用傳統(tǒng)物權(quán)“一物一權(quán)、排他獨(dú)占”的規(guī)則體系,致使數(shù)據(jù)產(chǎn)權(quán)制度建設(shè)面臨現(xiàn)實(shí)困境。
一是權(quán)屬界定缺乏可操作標(biāo)準(zhǔn)。數(shù)據(jù)的非競爭性使其可被多方主體同步使用,多主體共創(chuàng)屬性又貫穿數(shù)據(jù)采集、清洗、加工全鏈條,不同參與主體的貢獻(xiàn)邊界交織疊加,難以量化比對,因而缺乏統(tǒng)一的確權(quán)依據(jù)。實(shí)踐中權(quán)責(zé)劃分長期依賴經(jīng)驗(yàn)判斷,不僅削弱了制度的可執(zhí)行性,也使市場主體容易產(chǎn)生“不敢流通、不愿共享”的心理,大量數(shù)據(jù)資源因此長期沉淀,難以轉(zhuǎn)化為現(xiàn)實(shí)生產(chǎn)力。
二是安全與定價雙重壁壘制約流通。原始數(shù)據(jù)可無限復(fù)制、極易外泄,一旦交付流轉(zhuǎn)便難以有效管控,隱私泄露、商業(yè)秘密流失等風(fēng)險顯著抬升,進(jìn)而直接壓低市場主體的數(shù)據(jù)流轉(zhuǎn)意愿。同時,數(shù)據(jù)價值隨應(yīng)用場景、加工深度、調(diào)用頻次動態(tài)波動,缺乏統(tǒng)一的價值評估基準(zhǔn),導(dǎo)致交易成本居高不下,數(shù)據(jù)資源容易陷入“可用不可流、可流不易用”的困境,從而阻礙全國一體化數(shù)據(jù)市場的培育。
三是收益分配機(jī)制失衡。數(shù)據(jù)價值的形成源于多主體的協(xié)同參與,但長期以來缺乏成熟的貢獻(xiàn)量化與收益核算方法,導(dǎo)致頭部平臺能夠憑借技術(shù)優(yōu)勢、流量入口和數(shù)據(jù)資源優(yōu)勢主導(dǎo)收益分配規(guī)則,原始數(shù)據(jù)供給方、中小加工服務(wù)方難以得到合理回報(bào),這既會削弱多元市場主體的參與積極性,也易固化強(qiáng)者恒強(qiáng)的分配格局,不利于形成公平有序的數(shù)據(jù)產(chǎn)業(yè)生態(tài)。
四是全鏈條監(jiān)管治理存在短板。數(shù)據(jù)復(fù)制無痕、流轉(zhuǎn)隱秘的特性,使數(shù)據(jù)侵權(quán)、泄露問題具有發(fā)現(xiàn)難、溯源難、取證難等特征。與此同時,數(shù)據(jù)產(chǎn)權(quán)糾紛認(rèn)定標(biāo)準(zhǔn)、損失核算依據(jù)尚不明確,整體上會形成“侵權(quán)成本低、維權(quán)成本高”的治理困境。傳統(tǒng)的監(jiān)管模式難以覆蓋數(shù)據(jù)全生命周期,也難以統(tǒng)籌兼顧數(shù)據(jù)產(chǎn)權(quán)保護(hù)與數(shù)據(jù)安全管控。
詞元賦能數(shù)據(jù)產(chǎn)權(quán)制度建設(shè)的內(nèi)在邏輯
Token在不同場景有三種形態(tài):區(qū)塊鏈領(lǐng)域的“通證”,用于鏈上資產(chǎn)確權(quán)與流轉(zhuǎn);網(wǎng)絡(luò)安全領(lǐng)域的“令牌”,用于身份認(rèn)證與權(quán)限管理;人工智能大模型場景下的Token,是對數(shù)據(jù)解析與編碼后的處理單元。前兩類形態(tài)不依托原始數(shù)據(jù)生成,不承載語義信息,也不具備數(shù)據(jù)價值計(jì)量能力。詞元與原始數(shù)據(jù)有著本質(zhì)區(qū)別:原始數(shù)據(jù)是內(nèi)容本身,具有可復(fù)制、易外泄、價值模糊等特征,一旦流出難以收回;詞元是大模型解析、拆分和編碼后生成的標(biāo)準(zhǔn)化技術(shù)單元,不承載原始數(shù)據(jù)內(nèi)容,僅用于計(jì)量使用規(guī)模、記錄調(diào)用行為、支撐價值分配。將數(shù)據(jù)使用轉(zhuǎn)化為詞元來計(jì)量,可在不轉(zhuǎn)移原始數(shù)據(jù)的前提下,實(shí)現(xiàn)“數(shù)據(jù)不動、價值可流動”。依托獨(dú)特的底層技術(shù)機(jī)制,詞元能夠精準(zhǔn)回應(yīng)數(shù)據(jù)產(chǎn)權(quán)制度建設(shè)實(shí)踐中面臨的確權(quán)難、授權(quán)難、流轉(zhuǎn)難等問題。
一是以標(biāo)準(zhǔn)化計(jì)量破解確權(quán)難題。數(shù)據(jù)確權(quán)的核心難點(diǎn)在于價值缺乏統(tǒng)一度量標(biāo)尺。土地、器物等實(shí)物資產(chǎn)價值相對穩(wěn)定、權(quán)屬清晰,可通過市場價格明確產(chǎn)權(quán)比例,而數(shù)據(jù)價值隨應(yīng)用場景、加工深度、調(diào)用頻次動態(tài)變化,并由多方協(xié)同生產(chǎn),各方貢獻(xiàn)交織混雜,難以精準(zhǔn)界定權(quán)責(zé)份額,過去只能依靠經(jīng)驗(yàn)定性判定。詞元依托大模型統(tǒng)一運(yùn)算規(guī)則,將文本、圖像、算力消耗等各類異構(gòu)數(shù)據(jù)折算為可統(tǒng)計(jì)、可對比的標(biāo)準(zhǔn)化單元,形成了可比較的計(jì)量框架,能夠?yàn)閿?shù)據(jù)價值衡量提供基礎(chǔ)標(biāo)尺。
二是以非實(shí)體流轉(zhuǎn)破解流轉(zhuǎn)難題。數(shù)據(jù)流轉(zhuǎn)難的根本原因在于數(shù)據(jù)一旦流出就無法收回。詞元將市場流通的標(biāo)的物由原始文件變?yōu)闄?quán)益憑證,可以實(shí)現(xiàn)數(shù)據(jù)載體與價值權(quán)益的分離,即受讓方僅獲取詞元調(diào)用權(quán)與收益權(quán),無法占有原始數(shù)據(jù)。運(yùn)行上,詞元采用“遠(yuǎn)端請求、本地運(yùn)算”閉環(huán)模式:使用者提交需求后,數(shù)據(jù)處理在數(shù)據(jù)持有方本地服務(wù)器完成,外部用戶僅能獲取最終結(jié)果,全程無法接觸原始數(shù)據(jù)。這種“數(shù)據(jù)不動、價值動”的模式,使數(shù)據(jù)持有方始終掌握數(shù)據(jù)控制權(quán),從根本上降低了數(shù)據(jù)泄露與失控風(fēng)險。
三是以權(quán)益可分拆化解確權(quán)與分配的交織難題。解決不了確權(quán),分配就無從談起;分配不公,確權(quán)也沒有意義。詞元的權(quán)益可分拆屬性同時回應(yīng)了這兩個難題:將原本整體模糊的數(shù)據(jù)權(quán)益拆分為大量獨(dú)立的詞元單元,每個詞元對應(yīng)一份獨(dú)立的權(quán)益份額,各方主體依據(jù)貢獻(xiàn)度獲得相應(yīng)數(shù)量的詞元,各自持有獨(dú)立的詞元份額,這些份額成為確權(quán)和分配的客觀尺度和依據(jù)。
四是以收益精準(zhǔn)核算化解分配難題。分配難的根本原因是貢獻(xiàn)度無法衡量。數(shù)據(jù)產(chǎn)業(yè)鏈中,誰貢獻(xiàn)了多少、應(yīng)獲得多少收益,長期缺乏客觀依據(jù),平臺企業(yè)往往憑借渠道優(yōu)勢單方面決定分配比例,中小貢獻(xiàn)者處于弱勢。詞元具備可消耗、可清零的資源屬性,類似于碳配額或通信流量套餐。用戶每次調(diào)用數(shù)據(jù)或使用算力,消耗對應(yīng)額度,額度耗盡后權(quán)限自動失效。這一機(jī)制將數(shù)據(jù)使用行為轉(zhuǎn)化為可量化、可約束的資源消耗過程。詞元的收益精準(zhǔn)核算屬性提供了客觀的分配依據(jù),可以通過詞元調(diào)用量、消耗量等客觀指標(biāo)精準(zhǔn)核算各方貢獻(xiàn),調(diào)用越多、貢獻(xiàn)越大、收益越高。
五是以全鏈路可追溯破解監(jiān)管難題。監(jiān)管難的根本原因是侵權(quán)行為的“無痕性”。數(shù)據(jù)復(fù)制不留痕跡、流轉(zhuǎn)路徑無法追蹤,一旦發(fā)生泄露或侵權(quán),監(jiān)管部門難以知道誰泄露的、經(jīng)過哪些環(huán)節(jié)、擴(kuò)散到什么范圍,追責(zé)無從下手。詞元具備全生命周期操作信息自動存證功能,完整記錄從生成、流轉(zhuǎn)、調(diào)用到消耗的每一步操作,操作主體、發(fā)生時間、行為軌跡均自動留痕,構(gòu)成連續(xù)的操作記錄鏈條。當(dāng)發(fā)生侵權(quán)時,監(jiān)管機(jī)構(gòu)可以沿著詞元鏈條逆向追溯,精準(zhǔn)定位責(zé)任主體、還原行為過程、固定證據(jù)。
詞元賦能數(shù)據(jù)產(chǎn)權(quán)制度建設(shè)的現(xiàn)實(shí)約束與優(yōu)化路徑
當(dāng)前,詞元賦能數(shù)據(jù)產(chǎn)權(quán)制度建設(shè)仍面臨雙重約束。從內(nèi)在看,詞元目前僅是技術(shù)層面的權(quán)益標(biāo)記,現(xiàn)行法律尚未將其等同于物權(quán)或知識產(chǎn)權(quán),司法實(shí)踐中能否作為確權(quán)憑證尚無統(tǒng)一裁判標(biāo)準(zhǔn);無法核驗(yàn)原始數(shù)據(jù)生成階段的真實(shí)性與合法性,對“原生數(shù)據(jù)造假”“非授權(quán)使用”等問題難以有效應(yīng)對。從外部看,統(tǒng)一的詞元分詞、計(jì)量、定價標(biāo)準(zhǔn)體系尚未建立,詞元衍生權(quán)益與原始數(shù)據(jù)產(chǎn)權(quán)的權(quán)責(zé)邊界尚未厘清,頭部平臺仍可憑借算力、技術(shù)與入口優(yōu)勢在詞元生產(chǎn)、定價、流轉(zhuǎn)環(huán)節(jié)形成市場壟斷。
為此,應(yīng)重點(diǎn)推進(jìn)以下工作。一是強(qiáng)化頂層制度設(shè)計(jì)。立足“數(shù)據(jù)二十條”確立的“三權(quán)分置”制度框架,推動詞元深度嵌入數(shù)據(jù)要素市場化改革,明確詞元權(quán)屬生成、權(quán)益分置、流轉(zhuǎn)利用的制度規(guī)范,厘清原始數(shù)據(jù)產(chǎn)權(quán)與詞元衍生權(quán)益的邊界關(guān)系。二是加快統(tǒng)一標(biāo)準(zhǔn)建設(shè)。由相關(guān)部門牽頭統(tǒng)籌,加快制定詞元分詞規(guī)則、計(jì)量口徑、估值定價等基礎(chǔ)標(biāo)準(zhǔn),逐步構(gòu)建全國統(tǒng)一、兼容互通的詞元標(biāo)準(zhǔn)體系。三是健全法治監(jiān)管體系。完善配套法律法規(guī)與司法解釋,明確詞元權(quán)益的合法屬性與適用范圍,細(xì)化監(jiān)管規(guī)則與懲戒機(jī)制。四是規(guī)范市場競爭秩序。強(qiáng)化對平臺的反壟斷與不正當(dāng)競爭監(jiān)管,遏制頭部市場主體利用技術(shù)優(yōu)勢壟斷詞元資源、操縱定價規(guī)則,保障中小微市場主體平等參與權(quán)。五是升級安全防控能力。搭建詞元全流程追溯風(fēng)控體系,建立分級分類安全保護(hù)機(jī)制,有效防范新型數(shù)據(jù)安全風(fēng)險。六是深化場景生態(tài)拓展。持續(xù)推進(jìn)詞元技術(shù)迭代,提升多模態(tài)數(shù)據(jù)適配能力,豐富行業(yè)應(yīng)用場景,構(gòu)建技術(shù)、市場、監(jiān)管協(xié)同發(fā)展的良好產(chǎn)業(yè)生態(tài)。
(作者:程娜,系上海市習(xí)近平新時代中國特色社會主義思想研究中心研究員、上海大學(xué)馬克思主義學(xué)院教授)








