国产内射在线激情一区,偷自拍亚洲视频在线观看99,国产极品白嫩精品,欧美freesex10一13

安全資訊

我國高質(zhì)量場(chǎng)景數據集的供給現狀與發(fā)展策略

| 浙江大學(xué)光華法學(xué)院教授、博導,浙江大學(xué)國際戰略與法律研究院常務(wù)副院長(cháng),數字法治研究院首席專(zhuān)家 程樂(lè )

 

在新一輪數字化革命的推動(dòng)下,數據成為繼土地、勞動(dòng)力、資本、技術(shù)之后的第五大生產(chǎn)要素,并在不同社會(huì )領(lǐng)域配合其可復制性、可增強性、可訓練性、可互操作性等獨有特征,實(shí)現跨行業(yè)價(jià)值釋放。然而,未經(jīng)篩選整合的海量數據依然存在數據噪聲、非對稱(chēng)性、低完整性等內生問(wèn)題,難以通過(guò)可信利用轉化形成可持續的數據價(jià)值。面對迥然相異的產(chǎn)業(yè)技術(shù)需求,數據可以通過(guò)特定的格式和結構加以集合進(jìn)而發(fā)揮實(shí)質(zhì)價(jià)值,這一概念亦被稱(chēng)作“數據集”。在新質(zhì)生產(chǎn)力驅動(dòng)的全新技術(shù)業(yè)態(tài)下,以人工智能為代表的尖端科技正在對特定垂直場(chǎng)域中的“場(chǎng)景數據集”展現更強的上下文依賴(lài)性,醫療、交通、教育、金融等場(chǎng)景化的專(zhuān)業(yè)性數據集需求高速提升,特定應用場(chǎng)景的精細化對數據價(jià)值體系提出更高要求。此背景下,場(chǎng)景數據集的概念激活與高質(zhì)量發(fā)展正密切關(guān)聯(lián)我國數字產(chǎn)業(yè)經(jīng)濟的創(chuàng )新性配置、領(lǐng)域性轉型與技術(shù)性突破。為實(shí)現場(chǎng)景數據價(jià)值效用的乘數倍增與充分釋放,亟需打通我國關(guān)聯(lián)領(lǐng)域目前在數據供給、數據流通、數據評估、數據標準、數據開(kāi)放、數據共享等層面的堵點(diǎn),以“場(chǎng)景化加工能力”與“多樣化共享體系”兩大要點(diǎn)共同構建具有國際化樣板意義的高質(zhì)量場(chǎng)景數據集。

 

高質(zhì)量場(chǎng)景數據集的戰略定位與價(jià)值釋放

現代科技譜系中,數據集可能關(guān)聯(lián)區塊鏈、物聯(lián)網(wǎng)、人工智能、自動(dòng)化工程、高性能計算、地理信息系統等多端技術(shù),作為中樞性資源要素發(fā)揮復合效果。而在醫療、工業(yè)等具體領(lǐng)域的技術(shù)應用中,數據集的價(jià)值轉化則清晰展現應用牽引下的場(chǎng)景差異化需求。例如,工業(yè)場(chǎng)景需要傳感器數據等精度高、實(shí)時(shí)性強的數據集合,醫療場(chǎng)景的數據集建構則更多關(guān)聯(lián)隱私保護、數據保真度等要求。此背景下,面向具體場(chǎng)景的高質(zhì)量數據集供給日趨關(guān)鍵,并對各國科技產(chǎn)業(yè)的戰略性部署展現出重要價(jià)值。例如,歐盟委員會(huì )于2022年發(fā)布《高價(jià)值數據集實(shí)施法案》,明確環(huán)境數據、地理空間數據與地球觀(guān)測數據等特定場(chǎng)景高價(jià)值數據集的供給標準,進(jìn)一步完善面向工業(yè)、國防等重點(diǎn)場(chǎng)景的高質(zhì)量數據集供給。

在多類(lèi)應用情境中,人工智能對于高質(zhì)量場(chǎng)景數據集的需求尤為突出。2024年《政府工作報告》首次將“人工智能+”上升至國家戰略層面,明確提出深化大數據、人工智能等研發(fā)應用。近年來(lái),以DeepSeek、ChatGPT、Gemini、通義千問(wèn)、豆包為代表的大語(yǔ)言模型在各社會(huì )領(lǐng)域展現了卓越的應用潛力與現實(shí)效果,此類(lèi)生成式人工智能所采用的預訓練方法便是通過(guò)海量數據的累積效應實(shí)現模型的智能涌現與能力遷移。但一方面,預訓練模式對于模型專(zhuān)業(yè)領(lǐng)域的性能提升效果欠佳,未經(jīng)篩選的低質(zhì)量數據容易導致專(zhuān)業(yè)性問(wèn)題的“模型幻覺(jué)”(模型生成了不符合事實(shí)或毫無(wú)根據的信息);另一方面,預訓練所需的可用數據資源即將被用盡。在雙重挑戰的協(xié)同作用下,針對特定場(chǎng)景的高質(zhì)量數據集成為人工智能模型訓練的關(guān)鍵支撐,為現有數據局限下智能模型的訓練路徑優(yōu)化提供轉向可能。

 

其一,特定領(lǐng)域的高質(zhì)量數據注入能夠推動(dòng)人工智能掌握對應領(lǐng)域的關(guān)鍵特征與獨有規律,通過(guò)垂直場(chǎng)景的上下文關(guān)系增強模型訓練的精準性與針對性,實(shí)現高度專(zhuān)業(yè)化與個(gè)性化的人工智能解決方案與創(chuàng )新拓展。其二,高質(zhì)量場(chǎng)景數據集在模型微調與強化學(xué)習階段的嵌入亦可抑制數據偏差與特殊場(chǎng)景下模型的表現失衡,基于目標行業(yè)的標準與規范提升模型的合規性、可信度與可解釋性。其三,OpenAI推出的一系列推理模型正在數學(xué)、物理、化學(xué)等強邏輯專(zhuān)業(yè)領(lǐng)域展現專(zhuān)家級別的優(yōu)異表現,此類(lèi)后訓練模型的調試與性能增強對于專(zhuān)業(yè)領(lǐng)域數據與反饋的需求更為迫切。2024年末,OpenAI宣布將開(kāi)展強化微調(Reinforcement Fine-Tuning)的模型定制計劃,通過(guò)特定領(lǐng)域小規模數據集的重點(diǎn)訓練將通用模型轉化為專(zhuān)業(yè)模型,并展示了運用此種方法推動(dòng)GPT o1 Mini模型高水平推理罕見(jiàn)疾病成因的實(shí)例。未來(lái),更多專(zhuān)業(yè)維度的高質(zhì)量場(chǎng)景數據集將助推人工智能于更寬廣的重點(diǎn)領(lǐng)域展現“專(zhuān)家級”能力,實(shí)現模型性能與社會(huì )效率的場(chǎng)景化躍升。

 

我國高質(zhì)量場(chǎng)景數據集的供給現狀與發(fā)展困境

規范層面,我國早在2020年已認識到高質(zhì)量數據集供給對于經(jīng)濟社會(huì )發(fā)展的戰略?xún)r(jià)值,并發(fā)布《關(guān)于構建更加完善的要素市場(chǎng)化配置體制機制的意見(jiàn)》等系列政策。近年來(lái),我國相繼頒布《關(guān)于構建數據基礎制度更好發(fā)揮數據要素作用的意見(jiàn)》(2022年)《網(wǎng)絡(luò )數據安全管理條例》(2024年)等政策法規。然而,相較歐盟在《公共部門(mén)信息復用指令》等開(kāi)放數據法規基礎上所明確的《關(guān)于開(kāi)放數據和公共部門(mén)信息再利用指令》等規范及其落地效果,我國數據集的場(chǎng)景優(yōu)勢與場(chǎng)景化激活能力仍顯不成熟,特別是在數據基礎設施建設、公共數據開(kāi)放制度、數據集共享生態(tài)等層面仍顯不足。

實(shí)踐層面,我國數據資源總量?jì)?yōu)勢明顯,多樣化數據資源豐富,為高質(zhì)量場(chǎng)景數據集的高速增長(cháng)提供現實(shí)基礎。據新華社消息,2024年,全國數據市場(chǎng)交易規模預計超1600億元,同比增長(cháng)30%以上,其中場(chǎng)內市場(chǎng)數據交易(含備案交易)規模預計超300億元,同比實(shí)現翻番。根據全國數據資源調查工作組發(fā)布的《全國數據資源調查報告(2023年)》,2023年,全國數據生產(chǎn)總量達32.85ZB(澤字節),同比增長(cháng)22.44%。我國數據資源“產(chǎn)—存—算”的規模優(yōu)勢已基本形成。根據國際數據公司(IDC)的預測,中國“數據圈”(每年被創(chuàng )建、采集或是復制的數據集合)在2025年增至48.6ZB(澤字節),占全球27.8%,成為最大“數據圈”。同時(shí),線(xiàn)上支付、電子商務(wù)、共享經(jīng)濟、電子政務(wù)、智慧醫療等多樣化數字服務(wù)與數據應用場(chǎng)景在我國具有良好的社會(huì )接受度與廣闊的應用前景。得益于多民族文化的包容特性與社會(huì )秩序的長(cháng)期穩定,我國大多數民眾對跨場(chǎng)景數據應用持開(kāi)放態(tài)度,數字化需求趨于多樣,這為數據賦能的技術(shù)突破與多領(lǐng)域數字創(chuàng )新的涌現提供了社會(huì )土壤。然而,我國高質(zhì)量數據集供給的場(chǎng)景完善度不足,海量數據與多樣化場(chǎng)景優(yōu)勢的潛能仍有待進(jìn)一步釋放。

 

其一,我國面向場(chǎng)景的有效數據供給有待強化,數據資源總量?jì)?yōu)勢的價(jià)值轉化尚待釋放。“原始數據—場(chǎng)景數據—可用場(chǎng)景數據—高質(zhì)量場(chǎng)景數據集”的四階段數據轉化與價(jià)值遞進(jìn)中,作為中間產(chǎn)品的數據要素須經(jīng)清洗、標注、分析等加工活動(dòng)以實(shí)現價(jià)值創(chuàng )造。此過(guò)程中,三方面因素使得我國在基于差異化場(chǎng)景需求實(shí)現數據價(jià)值的場(chǎng)景化增長(cháng)方面存在一定難度。一是數據加工過(guò)程中投入與回報不成比例所引發(fā)的動(dòng)力匱乏問(wèn)題。專(zhuān)業(yè)化數據的高質(zhì)量標注需要龐大的資金投入且同時(shí)關(guān)聯(lián)安全責任風(fēng)險,這與數據應用的收益回報比例之間存在錯位。二是公共數據場(chǎng)景化加工的程度與緊迫性不足,難以發(fā)揮公共數據對于數據開(kāi)發(fā)利用的引領(lǐng)作用與催化作用。從現有國家政策來(lái)看,我國工業(yè)、醫療、交通、氣象等具體場(chǎng)景的數據供給能力尚未作為專(zhuān)門(mén)對象加以細化規定,領(lǐng)域差異化數據統歸于公共數據范疇的做法難以匹配垂直領(lǐng)域的細化要求。三是數據加工技術(shù)存在優(yōu)化空間,專(zhuān)業(yè)人才供給難以充分滿(mǎn)足需求,致使場(chǎng)景化加工效果欠佳。在數據標注自動(dòng)化工程尚未成熟的階段,將雜亂無(wú)序的低價(jià)值數據在工業(yè)互聯(lián)網(wǎng)等特定場(chǎng)景加工為標準化、目錄化、高價(jià)值數據資源需要高級別的專(zhuān)業(yè)技術(shù)技能,人工智能訓練與推理階段涉及多模態(tài)數據、高維度數據、跨領(lǐng)域數據,對計算機科學(xué)專(zhuān)業(yè)技術(shù)需求更加嚴苛,這為我國數據加工的現代化場(chǎng)景轉向帶來(lái)一定挑戰。
其二,受限于較低級別的數據開(kāi)放度與流通度,我國高質(zhì)量場(chǎng)景數據集的源頭供給能力有待提升。首先,我國公共數據開(kāi)放程度有限,關(guān)鍵主題高價(jià)值數據集的動(dòng)態(tài)數據、應用編程接口(API)與數據開(kāi)放許可證等標準尚不明晰,難以實(shí)現公共數據面向公眾和企業(yè)的有序開(kāi)放或強制開(kāi)放。其次,我國多領(lǐng)域數據源很大程度為大型數據平臺所壟斷,各行業(yè)數據普遍向平臺呈現聚攏態(tài)勢,根據全國數據資源調查工作組發(fā)布的《全國數據資源調查報告(2023年)》,大型平臺企業(yè)平均數據交互量約為行業(yè)重點(diǎn)企業(yè)的200倍以上。但同時(shí),大型平臺企業(yè)常以保護個(gè)人信息、防范安全風(fēng)險等理由拒絕共享,僅把數據用于自身場(chǎng)景構建。因此,大量中小型企業(yè)雖有豐富的場(chǎng)景數據需求,卻常處于“無(wú)數據可用”的困境。最后,在數據共享受限的背景下,我國數據交易亦存在供需失衡?!度珖鴶祿Y源調查報告(2023)》顯示,調研的27家交易所的數據產(chǎn)品中僅有17.9%實(shí)現交易。數據權屬界定、數據交易定價(jià)等固有難題引發(fā)的數據交易制度滯后問(wèn)題致使整體性數據產(chǎn)品成交率低迷,供需不匹配的現象廣泛存在,數據交易機構供給水平難以滿(mǎn)足場(chǎng)景數據需求。
其三,細分應用場(chǎng)景的技術(shù)標準仍有待完善,海量數據在垂直場(chǎng)景實(shí)現價(jià)值激活面臨挑戰。不同應用場(chǎng)景下,數據的格式、版本等特征性技術(shù)需求對應相異的數據標準與技術(shù)標準。例如,在柔性制造領(lǐng)域,數據需配合高頻采樣、實(shí)時(shí)監測的產(chǎn)業(yè)需求,在生產(chǎn)節拍精準同步等方面存在特定數據規范;在智能交通領(lǐng)域,位置、路況信息之外的視覺(jué)、雷達、激光測距等多樣化數據融合及相應技術(shù)標準對高精度地圖的更新則至關(guān)重要。然而,我國當前主要著(zhù)眼數據供給數量的增加,尚未針對場(chǎng)景深入開(kāi)展數據集標準化技術(shù)工程。此背景下,數據技術(shù)標準與架構的不統一增加了場(chǎng)景數據集成的復雜性,不同數據間的場(chǎng)景融合與預期場(chǎng)景的具體需求所關(guān)聯(lián)的轉換、加工與適配工作消耗過(guò)量資源,亦可能基于標準引發(fā)的數據誤差降低場(chǎng)景數據供給的整體質(zhì)量。人工智能模型結構高速迭代的產(chǎn)業(yè)背景下,多模態(tài)模型所需圖像、語(yǔ)音、文本、視頻等數據形式的融合需求日趨關(guān)鍵,推理模型對高邏輯領(lǐng)域復雜問(wèn)題的反饋數據需求也趨于迫切,多模態(tài)數據元模型擬定、元數據描述語(yǔ)言等新興技術(shù)標準問(wèn)題正快速更新,亟需有效回應。未來(lái),細分場(chǎng)景下數據技術(shù)標準與架構的滯后效應可能進(jìn)一步影響場(chǎng)景數據集在現代化技術(shù)需求下的流通與復用,阻礙數據流通、數據交易與數據價(jià)值增值的充分實(shí)現。
其四,現有規范體系下數據開(kāi)放目錄、數據開(kāi)放主體、數據開(kāi)放責任等配套制度在落地實(shí)施時(shí)面臨一定阻礙,存在供給不積極、供需不匹配、共享不充分等問(wèn)題。在實(shí)踐中,真正實(shí)現開(kāi)放的公共數據主要是各部門(mén)的政務(wù)數據,而此類(lèi)數據難以直接轉化為產(chǎn)業(yè)價(jià)值。而水電、通信、交通、醫療等重點(diǎn)場(chǎng)景數據則往往被拒絕開(kāi)放,或限縮開(kāi)放范圍。同時(shí),在《中華人民共和國網(wǎng)絡(luò )安全法》《中華人民共和國數據安全法》與《中華人民共和國個(gè)人信息保護法》這三大立法的實(shí)施進(jìn)程中,數據控制合法性判斷與數據流通利用的責任規則仍不明確,個(gè)人隱私與商業(yè)秘密難以在真正實(shí)現場(chǎng)景化數據開(kāi)放的情境中得到充分保護。此外,數據產(chǎn)權定義尚未統一,信息脫敏與數據加密等配套安全措施仍不完善,場(chǎng)景數據開(kāi)放時(shí)法律責任與權益保護也因而趨向復雜化和模糊化。綜合作用之下,即便我國近年已在相關(guān)法規中展現“推動(dòng)按用途加大供給使用范圍”等政策轉向,但重點(diǎn)場(chǎng)景的數據確權與開(kāi)放亦存在一定障礙,數據開(kāi)放與數據安全的平衡性問(wèn)題依然較難明確。

 

我國高質(zhì)量場(chǎng)景數據集的多方共享與突破路徑

其一,培育多方技術(shù),強化高價(jià)值數據的現代化場(chǎng)景加工能力。現代化技術(shù)驅動(dòng)的數字產(chǎn)業(yè)變革中,前沿科技對我國數據市場(chǎng)與場(chǎng)景化數據供給能力的重塑具有核心意義。首先,提升捕捉場(chǎng)景化需求的技術(shù)能力,積極運用機器學(xué)習中的自然語(yǔ)言處理與物聯(lián)網(wǎng)技術(shù)中的邊緣計算等方法提升對場(chǎng)景需求的精準分析與細化把控。同時(shí),對海量數據實(shí)現價(jià)值分層,結合深度學(xué)習構建數據價(jià)值分層管理體系,完成從低質(zhì)量數據到高價(jià)值數據的高效篩選與價(jià)值萃取。其次,繼續完善數據基礎設施與自研工程,從底層基礎層面提升數據存儲與計算能力??衫眉舛舜竽P屯怀龅奈谋緮祿瘶俗⒛芰εc經(jīng)濟化效益,持續打造契合國產(chǎn)人工智能發(fā)展脈絡(luò )的中文場(chǎng)景訓練數據語(yǔ)料庫。同時(shí),配合數據質(zhì)量評估體系,對專(zhuān)業(yè)數據、平臺數據等內容以特征導向展開(kāi)質(zhì)量評測,避免數據偏差與虛假多樣性等數據風(fēng)險。最后,人工智能等現代技術(shù)的積極運用是提升數據場(chǎng)景化加工能力的核心關(guān)鍵。例如,在醫療、金融等不適合進(jìn)行數據自由流動(dòng)的敏感場(chǎng)景,可利用人工智能轉化為偽數據或匿名數據的形式,結合大模型生成合成數據或進(jìn)行數據增強。同時(shí),運用隱私計算、聯(lián)邦學(xué)習與分布式訓練等技術(shù)方法,在保障數據安全的基礎上提升數據的場(chǎng)景化加工與供給能力,在回應場(chǎng)景化數據需求的同時(shí)平衡數據可用與可控之間的矛盾。此過(guò)程中,須將人工智能人才培育作為重點(diǎn)政策并細化培養方案,積極運用專(zhuān)項基金等激勵措施,帶動(dòng)專(zhuān)業(yè)化人才發(fā)展以實(shí)現場(chǎng)景需求下數據集建設與供給能力的躍升。

 

其二,在場(chǎng)景面向下推進(jìn)公共數據、平臺數據的可信開(kāi)放與充分共享。一方面,我國阿里、騰訊、百度、字節跳動(dòng)等超大型平臺企業(yè)對海量互聯(lián)網(wǎng)數據形成支配,但受到個(gè)人信息保護與平臺成本的限制,簡(jiǎn)單要求共享數據的思路亦不可行。為實(shí)現少數平臺數據壟斷向全行業(yè)數據良性共享的過(guò)渡,首先,可借鑒歐盟與美國等西方數據治理相關(guān)立法中的“守門(mén)人”制度,將滿(mǎn)足特定條件的大型平臺企業(yè)規定為“守門(mén)人”并要求其承擔特定的法律義務(wù)。進(jìn)一步細化“守門(mén)人”制度的限制,明確“守門(mén)人”將非個(gè)人數據共享給第三方的要求及其具體規定。其次,亦可借鑒知識產(chǎn)權制度中的保護時(shí)間設計,根據不同場(chǎng)景下的數據價(jià)值變化曲線(xiàn)要求,引導或鼓勵平臺在一段時(shí)間后共享具有公共屬性的數據以便其他主體進(jìn)行利用。最后,進(jìn)一步完善數據交易制度、數據產(chǎn)權制度與數據收益分配制度。協(xié)調場(chǎng)內交易與場(chǎng)外交易等相異場(chǎng)景需求下的具體措施,逐步形成面向數據資源化、資產(chǎn)化、資本化等不同層面,兼顧薪資分配、效益分配和股權分配等多種分配形式的分配機制與交易生態(tài)。另一方面,推動(dòng)公共數據標準化、共享機制和安全保障體系建設,兼顧政府、企業(yè)與個(gè)人等主體對公共數據開(kāi)放的需求與利益訴求,構建公共數據開(kāi)放與共享的深度協(xié)同機制并提升跨部門(mén)協(xié)調能力與政策執行力。

 

 

其三,聚焦重點(diǎn)場(chǎng)景,賦能多樣化場(chǎng)景,推進(jìn)政府主導與市場(chǎng)平衡下的前沿數據利用。針對場(chǎng)景面向下公共數據與高價(jià)值數據的利用,政府不宜對市場(chǎng)“無(wú)形之手”的靈活調控效果進(jìn)行過(guò)度干預,但也應對數據開(kāi)放、流通與利用過(guò)程的合規性與安全性承擔主要監管職責??梢圆捎谩皟刹阶摺钡姆绞酵苿?dòng)從重點(diǎn)場(chǎng)景到多樣化場(chǎng)景中良性秩序的形成。第一步,現階段暫時(shí)摒棄“不加區分、一并推進(jìn)”的做法,明確數據集供給的劃定應用場(chǎng)景。例如,《“數據要素×”三年行動(dòng)計劃(2024—2026年)》中明確指出,要“聚焦重點(diǎn)行業(yè)和領(lǐng)域,挖掘典型數據要素應用場(chǎng)景”。通過(guò)借鑒域外取得良好效果的重點(diǎn)場(chǎng)景,可在地方層面進(jìn)一步將高質(zhì)量場(chǎng)景數據集建設明確在普惠金融、醫療保險、物業(yè)服務(wù)等相對有限的細分板塊。在此基礎上,完善重點(diǎn)應用場(chǎng)景下的數據開(kāi)放細則,爭取實(shí)現相應領(lǐng)域數據的有需必應。第二步,在著(zhù)眼核心場(chǎng)景的同時(shí)持續推進(jìn)更大范圍場(chǎng)景的賦能效應。一是建立開(kāi)放清單動(dòng)態(tài)調整機制,同步維持開(kāi)放數據的實(shí)時(shí)更新與日常性維護工作,確保實(shí)時(shí)分析能力的精準高效與相應救濟途徑的暢通;二是以市場(chǎng)為主體推動(dòng)多樣化場(chǎng)景數據的衍生發(fā)展,先通過(guò)提高相似場(chǎng)景中的數據泛化表現以提升場(chǎng)景數據集的通用性,避免智能模型等末端應用過(guò)擬合于某些特定子場(chǎng)景;三是針對元宇宙、數字孿生、智能決策等數字時(shí)代的新型場(chǎng)景進(jìn)行數據需求的前瞻性剖析,并對智能監控等數字城市治理場(chǎng)景中出現的前沿問(wèn)題作出精準把握,提前布局以保障新興領(lǐng)域預見(jiàn)性政策的及時(shí)跟進(jìn)。

 

其四,優(yōu)化現有規范,明確數據架構與技術(shù)配套的場(chǎng)景化標準。一方面,持續完善頂層制度設計以發(fā)揮其對場(chǎng)景數據流通的保障與激勵機能??蓞⒖济绹缎畔⒆杂煞ā贰堵?lián)邦數據戰略》與歐盟《通用數據管理條例》《數據治理法案》等規范中關(guān)聯(lián)的可借鑒規則,建構公共部門(mén)信息復用與數據開(kāi)放的場(chǎng)景化框架并推動(dòng)本土化創(chuàng )新,鼓勵行業(yè)導向的戰略性數據集建設與數據開(kāi)放生態(tài)。同時(shí),在跨境電商、跨國物流、國際金融等場(chǎng)景中,跟進(jìn)關(guān)注《中歐全面投資協(xié)定》(CAI)、《全面與進(jìn)步跨太平洋伙伴關(guān)系協(xié)定》(CPTPP)、《區域全面經(jīng)濟伙伴關(guān)系協(xié)定》(RCEP)等國際經(jīng)貿協(xié)議中的數據跨境流動(dòng)規則,通過(guò)跨境場(chǎng)景的數據協(xié)同構建我國數據要素的獨特場(chǎng)景優(yōu)勢,合理分配國家的“剩余控制權”,保留更多的行業(yè)自律與跨行業(yè)協(xié)同空間。另一方面,持續完善場(chǎng)景面向的數據架構與技術(shù)標準。一是推動(dòng)差異場(chǎng)景下技術(shù)架構的統一化進(jìn)程,促進(jìn)高質(zhì)量數據的跨場(chǎng)景互通,推動(dòng)全國數據要素市場(chǎng)一體化。同時(shí),亦不可忽視場(chǎng)景間的差異性,避免盲目追求共性而損害數據質(zhì)量,跟進(jìn)補充對標特定場(chǎng)景的數據標準,特別關(guān)注大模型背景下多模態(tài)數據的可識別性與技術(shù)架構互通等問(wèn)題。二是在技術(shù)標準制定進(jìn)程中以前瞻視角關(guān)注人工智能等前沿技術(shù)的新型應用場(chǎng)景與產(chǎn)業(yè)模態(tài)。例如,明確不同場(chǎng)景下人工智能合成數據的質(zhì)量標準;細化無(wú)監督機器學(xué)習中場(chǎng)景數據抓取的合規技術(shù)標準;厘清大模型生成內容領(lǐng)域數據集提供者、模型開(kāi)發(fā)者與服務(wù)使用者之間的數據義務(wù)等。三是以場(chǎng)景為牽引,建立強制性的“數據法規”與自愿性的“數據標準”相結合的新型標準化體制。特別是在醫療、科研等專(zhuān)業(yè)細分場(chǎng)景的數據標準中,運用彈性較高的技術(shù)標準與倫理標準發(fā)揮“軟法先行”的正向效應,動(dòng)態(tài)探索各數據場(chǎng)景的適配規則。

 

【注:本文系國家社科基金年度項目“基于語(yǔ)料庫的網(wǎng)絡(luò )安全話(huà)語(yǔ)體系研究”(項目編號:24BYY151)、國家社科基金重大項目“建立健全我國網(wǎng)絡(luò )綜合治理體系研究”(項目編號:20ZDA062)、浙江省法學(xué)會(huì )重點(diǎn)課題“數字社會(huì )司法治理理論與規則研究”(項目編號:2024NA19)階段性成果】

(來(lái)源:人民論壇網(wǎng))

 

服務(wù)熱線(xiàn)

138-6598-3726

產(chǎn)品和特性

價(jià)格和優(yōu)惠

安徽靈狐網(wǎng)絡(luò )公眾號

微信公眾號

大地影院综艺资源| 亚洲精品无码专区久久| 丰满人妻一区二区三区无码AV| 国产精品毛片一区二区| 国产成人精品午夜视频| 久久精品夜夜夜夜夜久久|