專家解讀｜構(gòu)建面向AI時代的數(shù)據(jù)治理新生態(tài)

發(fā)布日期：2023-10-07 瀏覽次數(shù)：2663

生成式人工智能技術(shù)作為具有文本、圖片、音頻、視頻等內(nèi)容生成能力的模型及相關(guān)技術(shù)，正在世界范圍內(nèi)推動掀起一輪人工智能發(fā)展的新高潮。一方面，生成式人工智能帶來新的發(fā)展機遇，包括新的技術(shù)支持、新的業(yè)務類型和新的應用內(nèi)容；另一方面，生成式人工智能也伴生來源更為多樣、程度更為深刻的安全風險，涵蓋各類技術(shù)要素風險和數(shù)字內(nèi)容風險等。如何充分發(fā)揮生成式人工智能的價值潛能并有效實現(xiàn)其規(guī)范治理，已是各國共同關(guān)注的時代命題。

2023年7月13日，國家網(wǎng)信辦聯(lián)合國家發(fā)展改革委、教育部、科技部、工業(yè)和信息化部、公安部和廣電總局公布《生成式人工智能服務管理暫行辦法》（以下稱《辦法》），自2023年8月15日起施行。《辦法》作為全球第一部關(guān)于生成式人工智能治理的專門法律規(guī)范，具有重大意義。

《辦法》的謀篇布局堅持發(fā)展和安全并重的立法精神，規(guī)則的字里行間突出高質(zhì)量發(fā)展新階段語境下綜合治理的生態(tài)理念，是促進生成式人工智能技術(shù)健康發(fā)展和規(guī)范應用的有力舉措。

一方面，《辦法》的條文設(shè)計在數(shù)據(jù)治理、算法設(shè)計、內(nèi)容管理、虛假信息防范以及權(quán)益保護等多個層面，圍繞生成式人工智能服務劃定了全方位的合規(guī)要求；另一方面，《辦法》強調(diào)與《網(wǎng)絡安全法》《數(shù)據(jù)安全法》《個人信息保護法》《科學技術(shù)進步法》等上位法律，以及《互聯(lián)網(wǎng)信息服務算法推薦管理規(guī)定》《互聯(lián)網(wǎng)信息服務深度合成管理規(guī)定》等現(xiàn)行規(guī)范構(gòu)成的治理框架緊密銜接，形成關(guān)于生成式人工智能服務的立體規(guī)則體系。

從系統(tǒng)治理論的角度，可以認為生成式人工智能的三大核心要素包括數(shù)據(jù)、算力和算法：海量數(shù)據(jù)被認為是生成式人工智能的基石，充沛算力是生成式人工智能的基礎(chǔ)能力支撐，先進算法是生成式人工智能的基本實現(xiàn)途徑。應當指出的是，《辦法》的各項制度規(guī)范深刻洞察生成式人工智能的技術(shù)原理及其運行邏輯，特別是在《網(wǎng)絡安全法》《數(shù)據(jù)安全法》《個人信息保護法》等法律、行政法規(guī)的基礎(chǔ)上，著眼生成式人工智能服務語境下的數(shù)據(jù)治理，引入了多項專門規(guī)范，對于構(gòu)建面向AI時代的數(shù)據(jù)治理新生態(tài)具有重要的制度指引意義：

其一，《辦法》明確了生成式人工智能服務中的數(shù)據(jù)治理要求。《辦法》規(guī)定提供和使用生成式人工智能服務，應當遵守法律、行政法規(guī)，尊重社會公德和倫理道德，明確了新技術(shù)場景下數(shù)據(jù)新治理的價值底蘊。同時，《辦法》要求在算法設(shè)計、訓練數(shù)據(jù)選擇、模型生成和優(yōu)化、提供服務等過程中，采取有效措施防止民族、信仰、國別、地域、性別、年齡、職業(yè)、健康等歧視，強調(diào)在數(shù)據(jù)治理中防止偏見和歧視，并為生成式人工智能服務的可持續(xù)發(fā)展提供價值保障。

其二，《辦法》強調(diào)了生成式人工智能服務中數(shù)據(jù)處理的特別要求。一方面，《辦法》就相關(guān)數(shù)據(jù)處理活動規(guī)定了明晰的行為規(guī)則，生成式人工智能服務提供者在依法開展預訓練、優(yōu)化訓練等訓練數(shù)據(jù)處理活動中，一是應當使用具有合法來源的數(shù)據(jù)和基礎(chǔ)模型；二是涉及個人信息的，應當取得個人同意或者符合法律、行政法規(guī)規(guī)定的其他情形；三是采取有效措施提高訓練數(shù)據(jù)質(zhì)量，增強訓練數(shù)據(jù)的真實性、準確性、客觀性、多樣性。

另一方面，《辦法》就相關(guān)數(shù)據(jù)標注活動設(shè)定了專門的業(yè)務規(guī)則，規(guī)定在生成式人工智能技術(shù)研發(fā)過程中進行數(shù)據(jù)標注的，提供者應當制定符合辦法要求的清晰、具體、可操作的標注規(guī)則；開展數(shù)據(jù)標注質(zhì)量評估，抽樣核驗標注內(nèi)容的準確性；對標注人員進行必要培訓，提升尊法守法意識，監(jiān)督指導標注人員規(guī)范開展標注工作?！掇k法》關(guān)于標注規(guī)則、質(zhì)量評估和人員培訓的組合要求有益于數(shù)據(jù)資源的理解與利用，進而提高相關(guān)數(shù)據(jù)處理的準確性及其效能。

其三，《辦法》突出了生成式人工智能服務中數(shù)據(jù)生態(tài)的多方協(xié)同。《辦法》一是強調(diào)支持行業(yè)組織、企業(yè)、教育和科研機構(gòu)、公共文化機構(gòu)、有關(guān)專業(yè)機構(gòu)等在生成式人工智能技術(shù)創(chuàng)新、數(shù)據(jù)資源建設(shè)、轉(zhuǎn)化應用、風險防范等方面開展協(xié)作，旨在最大程度激發(fā)各方主體的積極性和參與度，提升共建共治共享的數(shù)據(jù)生態(tài)水平。二是強調(diào)推動生成式人工智能基礎(chǔ)設(shè)施和公共訓練數(shù)據(jù)資源平臺建設(shè)，促進算力資源協(xié)同共享，提升算力資源利用效能，推動公共數(shù)據(jù)分類分級有序開放，擴展高質(zhì)量的公共訓練數(shù)據(jù)資源，鼓勵采用安全可信的芯片、軟件、工具、算力和數(shù)據(jù)資源。從基礎(chǔ)設(shè)施到平臺建設(shè)，從算力資源到公共數(shù)據(jù)，《辦法》的規(guī)范設(shè)計有利于形成多方參與、安全可信的高質(zhì)量數(shù)據(jù)生態(tài)。

作者：吳沈括北京師范大學法學院博士生導師、中國互聯(lián)網(wǎng)協(xié)會研究中心副主任

本文轉(zhuǎn)載自：安徽省網(wǎng)信辦，原文鏈接：http://www.ahwx.gov.cn/wlyj/202308/t20230829_7048034.html