類ChatGPT應用中國版監管將如何影響行業發展?
2023-04-12 14:30:35 |來源:未央網
從2023年1月以來,一直處于輿論焦點的交互反饋式人工智能服務ChatGPT不斷給各行各業帶來驚嘆,近期各互聯網大廠陸續推出反饋交互式人工智能大模型。但同時也始終伴隨著巨大的爭議,如據媒體報道稱,2023年3月29日,著名安全機構生命未來研究所(Future of Life Institute,FLI)發布了一封包括特斯拉CEO伊隆·馬斯克,圖靈獎得主約書亞·本吉奧,以及蘋果聯合創始人史蒂夫·沃茲尼亞克等1125人簽名的公開信,信中呼吁全球所有機構暫停訓練比GPT-4更強大的AI至少六個月,并利用這六個月時間制定AI安全協議。
2023年4月11日,國家網信辦發布了《生成式人工智能服務管理辦法(征求意見稿)》(以下簡稱《生成式征求意見稿》),擬就類似ChatGPT等基于算法、模型、規則生成文本、圖片、聲音、視頻、代碼等內容的技術擬進行相應規范,坊間稱之為“類ChatGPT應用中國版監管”。那么如何看待這一規范?對行業后續影響如何?我們進行簡要討論。
一、如何看待《生成式征求意見稿》?
一是肯定了生成式人工智能技術服務的價值。正是由于其所具有的技術創新和應用創新價值,以及其所可能帶來的產業變革,才使得制訂規范使其健康發展成為需要。正如《生成式征求意見稿》第一條所明確,制訂目的是“為促進生成式人工智能健康發展和規范應用”。
(相關資料圖)
二是對原有相關規范框架進一步有針對性明確或細化。事實上,《互聯網信息服務深度合成管理規定》已經于2023年1月10日起施行;而在這之前,《互聯網信息服務算法推薦管理規定》也已經自2022年3月1日起施行。《互聯網信息服務算法推薦管理規定》中的五種算法推薦中包括生成合成類算法,而《互聯網信息服務深度合成管理規定》所稱的深度合成技術,是指利用深度學習、虛擬現實等生成合成類算法制作文本、圖像、音頻、視頻、虛擬場景等網絡信息的技術,本質上說本辦法所稱的生成式人工智能技術屬于深度合成技術。
本次出臺的《生成式征求意見稿》是“辦法”,一般來說,辦法強調指導性或操作方法,更強調處理問題或辦理事務的程序步驟方法等程序性規范性的要求;而針對算法推薦服務和深度合成技術則是“規定”,其強調利益調整的可預見和法律效力,相對“辦法”而言其法律條文屬性利益關系調整屬性要強一些。
三是力圖規范生成式人工智能服務的算法安全和內容傳播安全問題。正如馬斯克等人發出公開信中針對ChatGPT的安全性及其缺乏監管產生的巨大擔憂,《生成式征求意見稿》對AI算法模型開發和應用提出了一些要求。
就技術模型研發方面,《生成式征求意見稿》提出的監管要求主要包括安全和可信,主要措施是增強透明度,包括算法安全評估、算法備案、內容標識和預訓練與優化訓練等訓練數據合法、質量保證、保護個人信息和隱私等基本要求。
在算法應用帶來影響主要包括兩個方面,一是內容傳播,主要針對控制虛假內容,二是用戶合法權益保護,包括尊重和保護知識產權、反對不正當競爭,以及保護用戶人格權、個人信息、隱私等各類合法權益。
四是明確了生成式人工智能服務必須尊重知識產權。生成型人工智能可能在獲取數據時侵犯知識產權,同時其生成內容是否應受版權保護存在一定爭議。目前境內外針對人工智能生成內容相關知識產權問題,不同司法案例中裁判觀點略有不同,有觀點認為人工智能生成內容并不構成作品,無論是系統開發者還是用戶都不能對此主張著作權,而另有觀點則認為人工智能生成內容在一定條件下可以成為作品,系統開發者或使用者可以主張著作權。我們注意到美國版權局也認為,作為人工智能軟件本身并不能成為主張著作權的作者,但我們也看到媒體報道印度有將人工智能軟件被登記為作品共同作者的信息。這與技術和應用發展尚未完全成型是有關系的。
我們認為,就作者而言,人工智能本身并不能成為作者,因為其不能獨立承擔法律責任;就作品而言,生成式或其他人工智能服務生成內容本身在一定條件下是可以成為作品的,事實上很多時候人們很難分辨其是否是AI生成,此時用戶如果主張版權則需要相應承擔責任;就權利歸屬而言,目前包括OpenAI在內的應用平臺將用戶輸入信息所生成的輸入內容相關權益賦予用戶,因此用戶理論上說可以主張對該輸出的著作權,假如其構成作品的話,但是用戶可能也仍然并不一定能夠承擔其全部法律責任,AI服務提供商如果在輸出內容時數據來源不合法產生侵權等也可能需要對用戶承擔法律責任。
五是強調了生成式人工智能服務必須注意數據安全。目前生成式人工智能技術服務中,訓練數據來源、數據處理過程、數據共享情況仍然并不十分透明。從數據要素合規角度來說,要求數據來源合法,不違背法律強制性規定包括遵守重要數據保護規定、個人信息和隱私保護要求,同時保證數據質量包括數據標注質量,以及數據處理模型質量,另外還有數據存儲傳輸安全等。
從長遠看,還是要數據收益分配,落實數據產權基本制度,才可能形成真正健康的良好數據價值生態。針對AI訓練數據問題,目前重點關鍵的可能還是數據收集、數據共享、數據存儲和傳播的透明性和合規性問題。
二、生成式人工智能服務規范擬將出臺,將對各行各業產生什么影響?監管是否會阻礙目前大模型的研發和應用?大模型的功能應用是否會受到限制?未來監管將如何走向?
正如前所述,從《生成式征求意見稿》開宗明義就可以看到是為了“為促進生成式人工智能健康發展和規范應用”。《生成式征求意見稿》可以說是對《互聯網信息服務深度合成管理規定》《互聯網信息服務算法推薦管理規定》規定框架基礎上針對生成式人工智能應用的有關問題進行了相對明確要求。
簡而言之,《生成式征求意見稿》對大廠提出了更高要求,要求評估、備案和數據合法合規,且承擔模型合規、數據合規、內容生產責任和個人信息保護責任;對其他外接應用,要求數據合規和承擔內容生產、個人信息保護責任;對用戶,要求實名;對其他相關產品和服務應用,要求尊重知識產權、反對不正當競爭,以及保障產品服務質量以及保障合法資產權益等。
監管對于人工智能的行業競爭格局是否會產生影響?什么樣的公司會比較受益,或者說有足夠的實力和經驗去面對監管?目前比較一致的意見是,人工智能自然語言大模型本身因為涉及海量參數模型開發、海量數據訓練、巨大算力支持,并非一般小公司可承擔,從目前實踐來看這方面競爭甚至主要存在于中美兩國的互聯網巨頭之間。總體上,互聯網巨頭們面對監管還是謹慎小心,其自身也有比較強烈的社會責任感,總的來說有實力也有意愿以合規方式去推進研發和應用。
至于未來受益公司,我們認為凡是擁有大數據、大算力和大量應用用戶或應用場景的公司,還是會在其中享有很多機會的。比如目前以圖片類版權授權和使用為業務模式的公司,雖然會受到一定影響,但是只要其業務模式不斷調整,基于其擁有的巨量正版圖片數據資源,還是會有很多機會。
而針對一些垂直領域的行業應用,很多初創公司可以有很多機會,目前OpenAI和百度等國內廠家也正在朝這個方面走。但我們也看到,與通用型生成式人工智能技術應用相比,垂直領域的技術應用由于其數據庫來自相對專業領域,其數據庫準確性相對較高,匹配準確性也比較高,如很多人反映生成式人工智能在代碼方面的表現尤其令人印象深刻,因此有理由相信,在垂直領域行業應用中產生的內容安全和用戶合法權益保護問題,其安全風險和合規難度應該是遠遠小于通用型技術應用的。
未來監管走向將會如何呢?正如前所述,對AI算法來說,總的框架包括對技術研發和產品應用兩個方面。未來,針對AI算法模型開發監管中的安全、可信等要求會出臺一些細則、標準。主要措施是圍繞增強技術應用的透明度,包括算法安全評估具體標準、流程、格式要求,算法備案范圍、內容、流程、核驗等,內容標識的技術方法,與應用可能的結合等,包括預訓練與優化訓練等訓練數據的合法來源、共享、儲存、處理、質量要求等,以及在所有這些過程中如何保護個人信息等。從算法應用方面,針對內容傳播,在內容標識基礎上,可能會進一步研究具體標識方式和要求,強化服務提供者和用戶各自的責任;針對權益保護,可能會就知識產權、不正當競爭,以及用戶人格權、個人信息、隱私等各種權益通過配合司法實踐、其他行業監管等方式進行配套。因此后續監管可能會從細化和加強算法安全評估、算法備案,訓練數據使用和管理,用戶權益保護機制等角度展開。
三、對辦法征求意見稿若干修訂意見
一是關于服務名稱。“生成式人工智能服務”是否準確?對類ChatGPT技術應用來說,其核心特點是使用來自人類反饋的強化學習(RLHF,Reinforcement Learning from Human Feedback )來訓練的人工智能模型,也就是說反饋優化是其根本特征,而不僅僅是生成。因此生成式人工智能服務,是否改為反饋優化式人工智能服務?
二是關于與深度合成技術的關系。根據本征求意見稿,生成式人工智能是指基于算法、模型、規則生成文本、圖片、聲音、視頻、代碼等內容的技術。而根據《互聯網信息服務深度合成技術服務管理規定》深度合成技術,是指利用深度學習、虛擬現實等生成合成類算法制作文本、圖像、音頻、視頻、虛擬場景等網絡信息的技術,包括但不限于文本生成、圖像生成、語音轉換。由于涉及到監管框架問題,是否應該明確,“生成式人工智能服務”也是屬于“深度合成技術服務”的一種?總之要直接說明二者之間的關系。
三是關于預訓練和優化訓練數據合法性。征求意見稿第七條中,規定了服務提供者對數據合法性的要求,但是只是規定了尊重知識產權、保護個人信息和隱私,以及數據的真實性、準確性、客觀性、多樣性,是否還應該針對數據來源、數據共享、數據存儲、數據傳輸和出境等,應該作出明確要求?
四是關于反對用戶歧視的內容整合。征求意見第四條第二項,提到了防止出現歧視性內容,而第十二條又提到提供者不得根據用戶的種族、國別、性別等進行帶有歧視性的內容生成,內容似有重復,至少是不是可以考慮整合到一起?
五是關于算法監測監管要求相對缺失。征求意見稿第十五條規定,對于運行中發現、用戶舉報的不符合本辦法要求的生成內容,除采取內容過濾等措施外,應在3個月內通過模型優化訓練等方式防止再次生成,這個規定可以認為是服務提供者針對運行中出現的內容安全問題應作出的處置要求。但算法監管除了安全評估、算法備案以外,還包括算法安全監測,而安全監測并不僅僅包括內容監測,還包括數據處理合規、模型可靠性穩定性等安全事件處理要求,是不是可以把這一條整合成為算法監測的全面性要求。
六是關于內容標識的規定。《互聯網信息服務深度合成技術管理規定》明確要求對生成內容進行標識,包括一般標識,即深度合成服務提供者對使用其服務生成或者編輯的信息內容,應當采取技術措施添加不影響用戶使用的標識,并依法依規保存日志信息;顯著標識,即提供智能對話、合成人聲、人臉生成、沉浸式擬真場景等具有生成或者顯著改變信息內容功能服務的,應當在生成或者編輯的信息內容的合理位置、區域進行顯著標識。但征求意見稿第十六條僅規定對圖片、視頻進行標識,是否意味著“生成式”服務無須對其他內容進行標識?第十六條是否改為“提供者應當按照《互聯網信息服務深度合成管理規定》對生成內容進行標識”即可,至于文本內容無法標識的問題,屬于技術操作問題,可以具體研究成熟后具體實施。
作者:張烽,萬商天勤律師事務所合伙人,萬商天勤數字法律專業委員會主任,上海區塊鏈技術協會智庫專家/科技評價專家,中國移動通信聯合會元宇宙產業工作委員會常務委員,未來產業元宇宙50人論壇副理事長。
本文系未央網專欄作者:張 烽 發表,內容屬作者個人觀點,不代表網站觀點,未經許可嚴禁轉載,違者必究!關鍵詞:
標簽閱讀
-
類ChatGPT應用中國版監管將如何影響行業發展?
2023-04-12 -
昆侖萬維與阿里云達成戰略合作 將新建智算中心支撐大模型創新
2023-04-12 -
全球要聞:數讀湖北|首批“專精特新產業學院”名單公布,武...
2023-04-12 -
南財快評:一季度社融顯著回升,實體經濟融資需求回暖
2023-04-12 -
工資4000欠了10萬網貸怎么辦? 網貸如何辦理停息掛賬?
2023-04-12 -
欠銀行的錢沒有償還能力了怎么辦? 欠銀行的錢還不上會坐牢嗎?
2023-04-12 -
信用卡逾期不良記錄多久消除? 逾期多久上門催收?
2023-04-12 -
處理逾期的法務公司靠譜嗎? 逾期協商還款后還上信用嗎?
2023-04-12 -
信用卡逾期三個月會有什么后果? 信用卡逾期三個月還了還能...
2023-04-12 -
停息掛賬的好處和危害是什么? 欠債無力償還會凍結銀行卡嗎?
2023-04-12 -
個人欠債無力償還最好辦法是什么? 欠債無力償還會影響子女嗎?
2023-04-12 -
停息掛賬申請條件是什? 停息掛賬怎樣協商更好?
2023-04-12 -
RCEP將對15個成員國全面生效
2023-04-12 -
委托律師停息掛賬多少錢? 停息掛賬申請條件是什么?
2023-04-12 -
逾期了怎么才能恢復信用? 沒有逾期可以申請停息掛賬嗎?
2023-04-12 -
信用卡怎么申請停息掛賬? 信用卡停息掛賬會影響信用嗎?
2023-04-12 -
網商貸逾期后有什么影響? 網貸逾期如何正確解決?
2023-04-12 -
請律師處理網貸一般要多少錢? 網貸逾期影響是什么?
2023-04-12 -
無力還款最佳處理方法是什么? 逾期多久會上信用黑名單?
2023-04-12 -
信用卡逾期半年怎么辦? 信用卡逾期多久會上信用黑名單?
2023-04-12