偽造視訊變得越來越容易？為何這項技術如此可怕

Siri 深度學習 Apple · 發表 2018-09-11 10:19:58

摘要：自今年4月份以來，涉及美國前總統巴拉克·奧巴馬（Barack Obama）的一段一分鐘長視訊已被觀看過480萬次。視訊中，奧巴馬坐在椅子上，背景中可以看到美國國旗，他直接對著觀眾發表講話，並用淫穢下流的語言攻擊其繼任者唐納德·特朗普(Donald Trump)。或...

自今年4月份以來，涉及美國前總統巴拉克·奧巴馬（Barack Obama）的一段一分鐘長視訊已被觀看過480萬次。視訊中，奧巴馬坐在椅子上，背景中可以看到美國國旗，他直接對著觀眾發表講話，並用淫穢下流的語言攻擊其繼任者唐納德·特朗普(Donald Trump)。

或者更確切地說，當奧巴馬發表上述演講時，他的嘴脣會隨之而動。這段 ofollow,noindex">視訊實際上是由演員兼導演喬丹·皮勒(Jordan Peele)模仿奧巴馬的聲音製作的所謂“深度偽造”（Deepfake）內容。皮勒製作這段視訊是為了說明偽造音訊和視訊內容所帶來的危險，實際上這些內容並非奧巴馬所說。紐約大學的研究人員將“深度偽造”描述為“即將到來的威脅”。

“深度偽造”由何而來？

雖然操縱數字檔案並不是什麼新鮮事兒，但這種可信的偽造行為是通過使用一種人工智慧（AI）形式的計算機程式完成的。一個演算法被訓練來識別特定人的實際音訊或視覺記錄中的模式，這個過程被稱為深度學習。就像修改過的圖片一樣，一段音訊或視訊內容可以通過更換新元素(比如更換別人的臉或聲音)來改變，並無縫地將兩者結合起來。

與語音克隆技術結合使用時，這種手法最容易讓人產生誤導。語音克隆技術將音訊錄音分解成半音節的片段，然後可以重新組合成新詞，與蘋果的Siri和亞馬遜的Alexa等語音助手的建立方法相同。

為何“深度偽造”更可信？

深度學習演算法所包含的內容庫越大，它就顯得越真實。奧巴馬的“深度偽造”視訊需要56小時的錄音樣本，而蘋果公司錄製了10到20個小時的演講來製作Siri。許多報道現實，語音克隆只需用幾秒鐘的材料就能製成。

“深度偽造”如何傳播？

Vice旗下出版物《Motherboard》去年12月份報道稱，一個名叫“深度偽造”的Reddit使用者已經公開提供了一種使用開原始碼製作假視訊的演算法。以前，這項技術主要供學術和研究人員使用，但現在任何人都可以利用它。“深度偽造”開始成為一種製造虛假色情內容的手段，通常是把女明星的臉換到色情明星的身體上，以偽造從未發生過的色情場景。Reddit禁止使用者使用“深度偽造”技術，但這種技術卻得到了推廣，現在可以在FakeApp等應用程式上使用。

誰在偽造視訊？

在所謂的“技術軍備競賽”中，大學和研究公司都在開發自己的技術，以測試“深度偽造”的威力，並以此擊敗邪惡的偽造視訊從業者。卡內基梅隆大學的研究人員最近開發了一種系統，可以將特徵(比如面部表情)從某人的視訊傳輸到另一個人的合成影象上。許多初創公司包括Lyrebird和iSpeech，一直在銷售用於人機介面商業應用的語音克隆技術。

為何“深度偽造”引發擔憂？

令人擔心的是，“深度偽造”技術可能會過度損害聲譽，甚至引發騷亂。想象一下，在偽造的視訊中，總統候選人猥褻兒童，警察局長煽動針對少數群體的暴力行為，或者士兵犯下戰爭罪，結果會如何？政治家和商界領袖等知名人士面臨的風險尤其高，因為他們的錄音大多數是公開的。

對於普通人來說，尤其是女性，這項技術使“色情報復”成為可能，即使沒有真實的裸體照片或視訊存在。一旦一段視訊在網際網路上瘋傳，幾乎無法控制。另一個值得關注的問題是，隨著“深度偽造”技術的廣泛傳播，將使那些真正被錄下做壞事或說令人反感言論的人更容易指出，這些針對他們的證據都是偽造的。

“深度偽造”如何檢測？

製造出“深度偽造”內容的機器學習方式很難逆轉用以檢測它們。研究人員已經確定了一些線索，這些線索可能表明視訊不是真實的。例如，如果說話者有一段時間沒有眨眼睛，或者看上去有點兒呆板，但這樣的細節很容易被觀眾忽略。

通過提高某人視訊的色彩飽和度，可以從面部面板幾乎看不見的變化中檢測出他或她的脈搏，而由雜亂剪輯合成的影象會有不規則或不存在的血流。美國國防部正在開發一種工具來對付那些“深度偽造”內容。

有仁慈的用途嗎？

的確有。蘇格蘭公司CereProc為因疾病而失去自我的人們創造了數字聲音，聲音克隆可以通過再現歷史人物的聲音來達到 ITPklWYmYDO5IDNy0DZp9VZ0l2cmYiJ05WZkVHdzZkMl42Yu02bj5SZy9GdzRnZvN3byNWat5yd3dnRyUiR" target="_blank" rel="nofollow,noindex">教育目的。北卡羅萊納州立大學的一個專案就綜合了馬丁·路德·金（Martin Luther King）的一篇未錄音演講。

CereProc公司製作了約翰·肯尼迪總統（ President John F. Kennedy）的最後一次演講，他在發表講話前就遇刺身亡。然而，約翰·肯尼迪圖書館拒絕收錄這段錄音，稱其不符合規定。