專家解讀|構建面向AI時代的數據治理新生態(tài)

              發(fā)布日期:2023-10-07 瀏覽次數:1863

                  生成式人工智能技術作為具有文本、圖片、音頻、視頻等內容生成能力的模型及相關技術,正在世界范圍內推動掀起一輪人工智能發(fā)展的新高潮。一方面,生成式人工智能帶來新的發(fā)展機遇,包括新的技術支持、新的業(yè)務類型和新的應用內容;另一方面,生成式人工智能也伴生來源更為多樣、程度更為深刻的安全風險,涵蓋各類技術要素風險和數字內容風險等。如何充分發(fā)揮生成式人工智能的價值潛能并有效實現其規(guī)范治理,已是各國共同關注的時代命題。

                2023年7月13日,國家網信辦聯合國家發(fā)展改革委、教育部、科技部、工業(yè)和信息化部、公安部和廣電總局公布《生成式人工智能服務管理暫行辦法》(以下稱《辦法》),自2023年8月15日起施行?!掇k法》作為全球第一部關于生成式人工智能治理的專門法律規(guī)范,具有重大意義。

                《辦法》的謀篇布局堅持發(fā)展和安全并重的立法精神,規(guī)則的字里行間突出高質量發(fā)展新階段語境下綜合治理的生態(tài)理念,是促進生成式人工智能技術健康發(fā)展和規(guī)范應用的有力舉措。

                一方面,《辦法》的條文設計在數據治理、算法設計、內容管理、虛假信息防范以及權益保護等多個層面,圍繞生成式人工智能服務劃定了全方位的合規(guī)要求;另一方面,《辦法》強調與《網絡安全法》《數據安全法》《個人信息保護法》《科學技術進步法》等上位法律,以及《互聯網信息服務算法推薦管理規(guī)定》《互聯網信息服務深度合成管理規(guī)定》等現行規(guī)范構成的治理框架緊密銜接,形成關于生成式人工智能服務的立體規(guī)則體系。

                從系統(tǒng)治理論的角度,可以認為生成式人工智能的三大核心要素包括數據、算力和算法:海量數據被認為是生成式人工智能的基石,充沛算力是生成式人工智能的基礎能力支撐,先進算法是生成式人工智能的基本實現途徑。應當指出的是,《辦法》的各項制度規(guī)范深刻洞察生成式人工智能的技術原理及其運行邏輯,特別是在《網絡安全法》《數據安全法》《個人信息保護法》等法律、行政法規(guī)的基礎上,著眼生成式人工智能服務語境下的數據治理,引入了多項專門規(guī)范,對于構建面向AI時代的數據治理新生態(tài)具有重要的制度指引意義:

                其一,《辦法》明確了生成式人工智能服務中的數據治理要求。《辦法》規(guī)定提供和使用生成式人工智能服務,應當遵守法律、行政法規(guī),尊重社會公德和倫理道德,明確了新技術場景下數據新治理的價值底蘊。同時,《辦法》要求在算法設計、訓練數據選擇、模型生成和優(yōu)化、提供服務等過程中,采取有效措施防止民族、信仰、國別、地域、性別、年齡、職業(yè)、健康等歧視,強調在數據治理中防止偏見和歧視,并為生成式人工智能服務的可持續(xù)發(fā)展提供價值保障。

                其二,《辦法》強調了生成式人工智能服務中數據處理的特別要求。一方面,《辦法》就相關數據處理活動規(guī)定了明晰的行為規(guī)則,生成式人工智能服務提供者在依法開展預訓練、優(yōu)化訓練等訓練數據處理活動中,一是應當使用具有合法來源的數據和基礎模型;二是涉及個人信息的,應當取得個人同意或者符合法律、行政法規(guī)規(guī)定的其他情形;三是采取有效措施提高訓練數據質量,增強訓練數據的真實性、準確性、客觀性、多樣性。

                另一方面,《辦法》就相關數據標注活動設定了專門的業(yè)務規(guī)則,規(guī)定在生成式人工智能技術研發(fā)過程中進行數據標注的,提供者應當制定符合辦法要求的清晰、具體、可操作的標注規(guī)則;開展數據標注質量評估,抽樣核驗標注內容的準確性;對標注人員進行必要培訓,提升尊法守法意識,監(jiān)督指導標注人員規(guī)范開展標注工作?!掇k法》關于標注規(guī)則、質量評估和人員培訓的組合要求有益于數據資源的理解與利用,進而提高相關數據處理的準確性及其效能。

                其三,《辦法》突出了生成式人工智能服務中數據生態(tài)的多方協同。《辦法》一是強調支持行業(yè)組織、企業(yè)、教育和科研機構、公共文化機構、有關專業(yè)機構等在生成式人工智能技術創(chuàng)新、數據資源建設、轉化應用、風險防范等方面開展協作,旨在最大程度激發(fā)各方主體的積極性和參與度,提升共建共治共享的數據生態(tài)水平。二是強調推動生成式人工智能基礎設施和公共訓練數據資源平臺建設,促進算力資源協同共享,提升算力資源利用效能,推動公共數據分類分級有序開放,擴展高質量的公共訓練數據資源,鼓勵采用安全可信的芯片、軟件、工具、算力和數據資源。從基礎設施到平臺建設,從算力資源到公共數據,《辦法》的規(guī)范設計有利于形成多方參與、安全可信的高質量數據生態(tài)。

                作者:吳沈括 北京師范大學法學院博士生導師、中國互聯網協會研究中心副主任

                    本文轉載自:安徽省網信辦,原文鏈接:http://www.ahwx.gov.cn/wlyj/202308/t20230829_7048034.html

              曰韩激情无码免费毛片,亚洲乱码精品一区二区不卡,国产在线精品一区在线观看;,亚洲人在线观看影院