站長之家(ChinaZ.com) 4月3日 消息:在前總統唐納德特朗普即將被起訴的謠言泄露后不久,網上出現了聲稱他被捕的圖片。這些圖像看起來像真實的新聞照片,它們卻是假的。這些虛假照片都是由生成式人工智能系統生成的。
最近,生成式 AI,包括DALL-E、Midjourney和Stable Diffusion等圖像生成器以及Bard、ChatGPT、Chinchilla和LLaMA等文本生成器風靡全網。通過機器學習算法與數十億條人類生成的內容相結合,這些系統似乎可以做任何事情,從根據根據創建一個怪異逼真的圖像,合成喬·拜登總統的語音演講,將視頻中的一個人的肖像替換另一個人,或根據標題提示寫一篇連貫的800字專欄文章等等。
即使在早期,生成式 AI 也能夠創建高度逼真的內容,很多普通人無法可靠地區分真人和 AI 生成的人的圖像。一旦AI生成的內容成熟的應用在音頻和視頻領域,那么可能帶來災難性的后果。
【資料圖】
比如,用AI制作一段某公司CEO透露公司利潤下降了20%的視頻,這可能導致數十億美元的市場份額損失;制作一段世界領導人威脅采取軍事行動的視頻,這可能引發一場地緣政治危機;或者在一段色情視頻中插入任何人的肖像,可能給任何人帶來困擾。制造真人的假視頻的技術正變得越來越容易。
生成式人工智能的進步將意味著,虛假但在視覺上令人信服的內容將在網上泛濫,導致一個更加混亂的信息生態系統。
隨著生成式人工智能的進步,幾乎可以肯定這只是一個開始。這無疑需要有一些合理的、技術上可行的干預措施來幫助減輕這些濫用。一名專門研究圖像取證的計算機科學家、伯克利計算機科學教授主張Hany Farid給出的建議是,關鍵的方法是給AI生成的內容添加水印。以下是他的一些觀點:
水印
在文件和其他物品上做標記以證明其真實性、表明所有權和打擊偽造的做法由來已久。比如攝影巨頭Getty Images,為目錄中的所有數字圖像添加了可見水印。這樣客戶就可以在保護Getty資產的同時自由瀏覽圖像。
不易察覺的數字水印也用于數字版權管理。水印可以添加到數字圖像中,例如,每10個圖像像素調整一次,使其顏色(通常是0到255范圍內的數字)為偶數。因為這個像素調整很小,水印是難以察覺的。而且,由于這種周期性模式不太可能自然出現,而且很容易驗證,因此可以用于驗證圖像的出處。
即使中等分辨率的圖像也包含數百萬像素,這意味著可以在水印中嵌入附加信息,包括編碼生成軟件的唯一標識符和唯一用戶ID。這種相同類型的不可察覺水印可以應用于音頻和視頻。
理想的水印是不易察覺的,而且還能適應簡單的操作,如裁剪、調整大小、顏色調整和轉換數字格式。盡管像素顏色水印示例由于顏色值可以改變而不具有彈性,已經提出了許多試圖消除水印的策略。
水印和的AI圖像生成器
通過對所有訓練數據加水印,這些水印可以被植入到生成式AI系統中,之后生成的內容將包含相同的水印。這種嵌入水印很有吸引力,因為它意味著生成式AI工具可以開源——就像圖像生成器Stable Diffusion一樣——而不用擔心水印過程可能會從圖像生成器的軟件中刪除。Stable Diffusion也有一個水印功能,但因為它是開源的,任何人都可以簡單地刪除那部分代碼。
OpenAI正在試驗一種系統,為ChatGPT的作品添加水印。當然,段落中的字符不能像像素值那樣進行調整,因此文本水印采用了另一種形式。
基于文本的生成式AI是基于生成句子中產生下一個最合理的單詞。例如,從“一個AI系統可以……”這個句子片段開始,ChatGPT將預測下一個單詞應該是“學習”、“預測”或“理解”。與這些單詞相關對應出現在下一個句子中出現的單詞的可能性是有一定概率的。ChatGPT從它所訓練的大量文本中學習這些概率。
生成的文本可以通過秘密地標記單詞子集,然后將一個單詞的選擇偏向于同義詞標記單詞來標記水印。例如,可以使用帶標簽的單詞“領悟”來代替“理解”。通過以這種方式定期選擇偏置的單詞,基于標記單詞的特定分布為文本體加水印。這種方法不適用于簡短的推文,但通常對800字或更長的文本有效,具體取決于水印細節。
所有內容加上水印,以便更容易地進行下游識別,并在必要時進行干預。如果該行業不自愿這樣做,立法者可以通過法規來執行這一規定。毫無道德的人當然不會遵守這些標準。不過,如果蘋果、谷歌應用商店、亞馬遜、谷歌、微軟云服務和GitHub等主要網絡門戶通過禁止違規軟件來執行這些規定,危害將會大大減少。
簽署真實內容
從另一個角度解決這一問題的話,可以采用類似的方法在捕獲點驗證原始視聽記錄。一款專門的攝像應用可以在錄制內容時對其進行加密簽名。如果不留下證據,就沒有辦法篡改這個簽名。然后將簽名存儲在受信任簽名的集中列表中。
雖然這個方法不適用于文本,但可以驗證視聽內容是否為人類生成。為認證媒體創建標準的合作組織內容來源和認證聯盟(C2PA),最近發布了一個開放規范來支持這種方法。隨著Adobe、微軟、英特爾、BBC和許多其他機構加入這,C2PA已經做好準備,可以提供有效且廣泛部署的身份認證技術。
對人類生成的內容和人工智能生成的內容進行聯合簽名和水印處理,雖然不能防止一切形式的濫用,但可以提供一定程度的保護。任何安全措施都必須不斷調整和完善,因為對手會找到將最新技術武器化的新方法。
就像幾十年來一直在與垃圾郵件、惡意軟件和網絡釣魚等其他網絡威脅進行斗爭一樣,我們應該為一場同樣曠日持久的戰斗做好準備,以抵制生成式人工智能各種形式的濫用行為。
(舉報)
責任編輯: