偽造視訊變得越來越容易?為何這項技術如此可怕
自今年4月份以來,涉及美國前總統巴拉克·奧巴馬(Barack Obama)的一段一分鐘長視訊已被觀看過480萬次。視訊中,奧巴馬坐在椅子上,背景中可以看到美國國旗,他直接對著觀眾發表講話,並用淫穢下流的語言攻擊其繼任者唐納德·特朗普(Donald Trump)。
或者更確切地說,當奧巴馬發表上述演講時,他的嘴脣會隨之而動。這段 ofollow,noindex">視訊 實際上是由演員兼導演喬丹·皮勒(Jordan Peele)模仿奧巴馬的聲音製作的所謂“深度偽造”(Deepfake)內容。皮勒製作這段視訊是為了說明偽造音訊和視訊內容所帶來的危險,實際上這些內容並非奧巴馬所說。紐約大學的研究人員將“深度偽造”描述為“即將到來的威脅”。
“深度偽造”由何而來?
雖然操縱數字檔案並不是什麼新鮮事兒,但這種可信的偽造行為是通過使用一種人工智慧(AI)形式的計算機程式完成的。一個演算法被訓練來識別特定人的實際音訊或視覺記錄中的模式,這個過程被稱為深度學習。就像修改過的圖片一樣,一段音訊或視訊內容可以通過更換新元素(比如更換別人的臉或聲音)來改變,並無縫地將兩者結合起來。
與語音克隆技術結合使用時,這種手法最容易讓人產生誤導。語音克隆技術將音訊錄音分解成半音節的片段,然後可以重新組合成新詞,與蘋果的Siri和亞馬遜的Alexa等語音助手的建立方法相同。
為何“深度偽造”更可信?
深度學習演算法所包含的內容庫越大,它就顯得越真實。奧巴馬的“深度偽造”視訊需要56小時的錄音樣本,而蘋果公司錄製了10到20個小時的演講來製作Siri。許多報道現實,語音克隆只需用幾秒鐘的材料就能製成。
“深度偽造”如何傳播?
Vice旗下出版物《Motherboard》去年12月份報道稱,一個名叫“深度偽造”的Reddit使用者已經公開提供了一種使用開原始碼製作假視訊的演算法。以前,這項技術主要供學術和研究人員使用,但現在任何人都可以利用它。“深度偽造”開始成為一種製造虛假色情內容的手段,通常是把女明星的臉換到色情明星的身體上,以偽造從未發生過的色情場景。Reddit禁止使用者使用“深度偽造”技術,但這種技術卻得到了推廣,現在可以在FakeApp等應用程式上使用。
誰在偽造視訊?
在所謂的“技術軍備競賽”中,大學和研究公司都在 開發 自己的技術,以測試“深度偽造”的威力,並以此擊敗邪惡的偽造視訊從業者。卡內基梅隆大學的研究人員最近開發了一種系統,可以將特徵(比如面部表情)從某人的視訊傳輸到另一個人的合成影象上。許多初創公司包括Lyrebird和iSpeech,一直在銷售用於人機介面商業應用的語音克隆技術。
為何“深度偽造”引發擔憂?
令人擔心的是,“深度偽造”技術可能會過度損害聲譽,甚至引發騷亂。想象一下,在偽造的視訊中,總統候選人猥褻兒童,警察局長煽動針對少數群體的暴力行為,或者士兵犯下戰爭罪,結果會如何?政治家和商界領袖等知名人士面臨的風險尤其高,因為他們的錄音大多數是公開的。
對於普通人來說,尤其是女性,這項技術使“色情報復”成為可能,即使沒有真實的裸體照片或視訊存在。一旦一段視訊在網際網路上瘋傳,幾乎無法控制。另一個值得關注的問題是,隨著“深度偽造”技術的廣泛傳播,將使那些真正被錄下做壞事或說令人反感言論的人更容易指出,這些針對他們的證據都是偽造的。
“深度偽造”如何檢測?
製造出“深度偽造”內容的機器學習方式很難逆轉用以檢測它們。研究人員已經確定了一些線索,這些線索可能表明視訊不是真實的。例如,如果說話者有一段時間沒有眨眼睛,或者看上去有點兒呆板,但這樣的細節很容易被觀眾忽略。
通過提高某人視訊的色彩飽和度,可以從面部面板幾乎看不見的變化中檢測出他或她的脈搏,而由雜亂剪輯合成的影象會有不規則或不存在的血流。美國國防部正在開發一種工具來對付那些“深度偽造”內容。
有仁慈的用途嗎?
的確有。蘇格蘭公司CereProc為因疾病而失去自我的人們創造了數字聲音,聲音克隆可以通過再現歷史人物的聲音來達到 ITPklWYmYDO5IDNy0DZp9VZ0l2cmYiJ05WZkVHdzZkMl42Yu02bj5SZy9GdzRnZvN3byNWat5yd3dnRyUiR" target="_blank" rel="nofollow,noindex">教育 目的。北卡羅萊納州立大學的一個專案就綜合了馬丁·路德·金(Martin Luther King)的一篇未錄音演講。
CereProc公司製作了約翰·肯尼迪總統( President John F. Kennedy)的最後一次演講,他在發表講話前就遇刺身亡。然而,約翰·肯尼迪圖書館拒絕收錄這段錄音,稱其不符合規定。