在政策支持與產(chǎn)業(yè)需求的雙重帶動下,我國數(shù)據(jù)標注產(chǎn)業(yè)正處于爆發(fā)式增長的風口。面對日趨激烈的全球科技競爭和廣闊的市場需求,我國需加快在數(shù)據(jù)要素及標注數(shù)據(jù)確權、流通安全以及“主權AI”建設等方面的布局,推動數(shù)據(jù)標注產(chǎn)業(yè)在高質(zhì)量發(fā)展的道路上行穩(wěn)致遠。
數(shù)據(jù)標注是對數(shù)據(jù)進行添加標記、說明、解釋、分類和編碼的過程,是提升人工智能算法、模型核心能力的關鍵環(huán)節(jié)。數(shù)據(jù)標注質(zhì)量直接關系到模型輸出的準確性和可靠性。
隨著各行業(yè)數(shù)字化、智能化進程的加速推進,數(shù)據(jù)標注自動化水平顯著提升,專業(yè)化趨勢日益明顯,應用領域也在不斷拓展和深化,從傳統(tǒng)的語音轉(zhuǎn)寫、圖片文字識別等領域,向更高端、更復雜的場景延伸,應用價值持續(xù)提升。
國家數(shù)據(jù)局近日發(fā)布的數(shù)據(jù)顯示,我國七個數(shù)據(jù)標注基地數(shù)據(jù)標注規(guī)模再創(chuàng)新高,總規(guī)模達到17282TB,相當于中國國家圖書館數(shù)字資源總量的6倍左右;目前已形成醫(yī)療、工業(yè)、教育等行業(yè)的高質(zhì)量數(shù)據(jù)集335個;賦能121個國產(chǎn)人工智能大模型研發(fā);引進和培育標注企業(yè)223家;標注從業(yè)人員達5.8萬人;帶動數(shù)據(jù)標注行業(yè)相關產(chǎn)值超過83億元。
我國作為人工智能大國,必須加快在數(shù)據(jù)要素及標注數(shù)據(jù)確權、數(shù)據(jù)流通安全以及“主權AI”建設等方面的布局,以確保在人工智能領域的國際競爭力和話語權。
一是要完善數(shù)據(jù)要素確權機制,筑牢數(shù)據(jù)市場的基石。數(shù)據(jù)要素確權是數(shù)據(jù)標注產(chǎn)業(yè)健康發(fā)展的前提和基礎。在數(shù)字經(jīng)濟時代,數(shù)據(jù)已成為至關重要的生產(chǎn)要素,其權屬問題直接關系到數(shù)據(jù)的流通、利用和價值實現(xiàn)。數(shù)據(jù)的無形性、易復制性及權屬界定模糊等特性,使得數(shù)據(jù)要素的確權工作成為亟待解決的棘手問題。
我國出臺的《中華人民共和國網(wǎng)絡安全法》《中華人民共和國數(shù)據(jù)安全法》《中華人民共和國個人信息保護法》等法規(guī)制度,為數(shù)據(jù)要素確權提供了法律基礎。但在實際操作中,仍面臨如何界定數(shù)據(jù)權屬、如何平衡數(shù)據(jù)主體與數(shù)據(jù)使用者之間的利益關系等問題,需進一步深入探索和完善相關機制。
二是要明確標注數(shù)據(jù)的權屬歸屬和利益分配機制。作為在原始數(shù)據(jù)基礎上通過人工或機器標注而產(chǎn)生的新數(shù)據(jù),標注數(shù)據(jù)的權屬問題需綜合考慮原始數(shù)據(jù)提供方、標注服務提供方及標注數(shù)據(jù)使用方等多方權益。同時,應加強法律法規(guī)的宣傳和培訓力度,提高產(chǎn)業(yè)界的法律意識和合規(guī)意識,確保數(shù)據(jù)要素確權工作順利進行。
三是構(gòu)建完善數(shù)據(jù)流通安全治理制度體系,保障數(shù)字經(jīng)濟穩(wěn)健發(fā)展的生命線。數(shù)據(jù)標注過程可能涉及敏感信息的處理和傳輸,如個人隱私數(shù)據(jù)、商業(yè)機密等。一旦這些數(shù)據(jù)泄露或被惡意利用,可能會給個人和社會帶來重大損失。
我國已經(jīng)出臺一系列數(shù)據(jù)流通安全相關的法律法規(guī)和政策文件,如《關于完善數(shù)據(jù)流通安全治理 更好促進數(shù)據(jù)要素市場化價值化的實施方案》等,但在實際操作中,仍需深入探索如何保障數(shù)據(jù)在流通過程中的安全性、完整性和可追溯性等,包括建立嚴格的數(shù)據(jù)流通安全管理制度,明確數(shù)據(jù)提供方、數(shù)據(jù)接收方和數(shù)據(jù)流通平臺等各方的責任和義務;加強數(shù)據(jù)流通安全技術的應用和創(chuàng)新,如采用數(shù)字水印、數(shù)據(jù)指紋、區(qū)塊鏈等技術手段,確保數(shù)據(jù)流通過程中的安全性和可追溯性;加強與國際社會合作與交流,共同推動全球數(shù)據(jù)流通安全治理體系的建設。
四是加強“主權AI”建設,提升國家核心競爭力。在全球科技競爭日益激烈的今天,“主權AI”建設已成為各國關注的焦點。我國作為人工智能大國,必須加快“主權AI”建設的步伐,確保在人工智能領域的國際話語權和競爭力。
具體到數(shù)據(jù)標注產(chǎn)業(yè),我們應建立自主安全可控的AI基礎設施,確保關鍵核心技術基本實現(xiàn)自主控制;加強AI底層技術領域領軍人才培養(yǎng),加強科研創(chuàng)新;持續(xù)優(yōu)化產(chǎn)業(yè)布局,推動產(chǎn)業(yè)集群發(fā)展;積極參與國際AI標準制定,提高我國AI技術的國際認可度和影響力。此外,在“主權AI”建設過程中,還需注重保護個人隱私等敏感信息的安全,確保AI技術的合規(guī)應用和發(fā)展。
完善數(shù)據(jù)要素確權機制、構(gòu)建數(shù)據(jù)流通安全治理體系、加強“主權AI”建設,不僅是保障數(shù)據(jù)標注產(chǎn)業(yè)健康發(fā)展的必由之路,更是推動我國數(shù)字經(jīng)濟邁上新臺階的關鍵舉措。
通過政策引導、技術創(chuàng)新與國際合作的多重驅(qū)動,我國數(shù)據(jù)標注產(chǎn)業(yè)將不斷提升自身競爭力,為人工智能技術的深入應用與數(shù)字經(jīng)濟的蓬勃發(fā)展提供堅實支撐。
(作者:付建龍系江蘇經(jīng)貿(mào)職業(yè)技術學院副院長、中國法治現(xiàn)代化研究院特邀研究員;杜帥系對外經(jīng)貿(mào)大學社會保障與企業(yè)金融研究中心主任)