假新聞氾濫,“內容驗證”會成為下一個爆點嗎?
編者按:這是一個人人都可以釋出新聞的時代,但是這也導致了假新聞、假視訊、假內容的泛濫。這些虛假資訊的惡果早已顯現,甚至可能影響了歷史程序。如何才能解決這個問題?社交媒體管理系統Hootsuite CEO Ryan Holmes在一篇 36068/is-content-validation-the-next-growth-industry" target="_blank" rel="nofollow,noindex">文章 中探討了各種內容驗證的機制,並且認為這有可能催生下一波的數字化浪潮。
你大概看過那個假視訊了吧——那個奧巴馬稱特朗普為“徹頭徹尾的大笨蛋”的假視訊。聲音做得不是完全像,但是這個剪輯——這個花了BuzzFeed的視訊專業人士56個小時創作出來的東西——卻生動地說明了deepfake(換臉工具,幾乎可以讓任何人說任何東西)等的威脅已經開始萌芽。
Deepfake技術已經被用來將名人的臉植入到色情電影裡面,認識到它對政治的潛在危險並不難。將假宣告嫁接到國家行為者口中很容易就會引發一場國際爭端,股市恐慌,或者甚至一場徹底的戰爭。這種威脅絕非科幻小說,實際上,它距離我們是如此之近以至於美國國防部負責新興軍事技術的DARPA都已經組建了一個官方媒體取證實驗室來尋找假冒內容。
當然了,摻假視訊並不是假新聞前線的唯一威脅。2016年的美國總統大選就提供了一個有說服力的例子,說明了普通老套的假新聞頭條,在社交媒體的發酵下,就能夠影響世界事件的程序。從此以後,我們對事後審查已經變得習以為常,偶爾也會對在我們的新聞流上傳播的可疑故事信以為真。(真正的新聞跟一些政治家的假新聞摻雜在一起是沒有幫助的)到頭來,我們只會對誰和什麼值得信任變得十分不確定——如果說還有信任的話。
社交媒體坐在許多挑戰的火山口上。這裡是大家現在獲取新聞的主要場所,令人悲哀的是,也是最容易被人操縱的地方之一。作為一個在社交媒體上建立起職業生涯的人,我發現這一點令人擔憂。我對社會渠道建立聯絡和開啟對話的威力有很大的信心。像Facebook和Twitter這樣的網路已經成為網際網路管道設施的一部分,是不會消失的。但是虛假內容——不僅僅是古怪、容易被摒棄陰謀論,也包括能夠讓專家也忍不住多看兩眼的令人信服地視訊,這些內容的傳播已經成為越來越大的威脅。
在這種氣候下如何才能恢復對線上內容的信任和信心呢?在我看來,前面的道路不僅是演算法調整或者新的一套監管。這個挑戰的複雜性是這些手段處理不了的。從根本上來說,我們是在討論對我們在網上看到和聽見的東西的信心問題,關於信任讓個人、公司以及整個國家做出知情決定的裸資料的問題。貼創可貼式的修補方案的適用時間早就過去了。相反,我們也許是在討論數字化時代的下一個增長行業:內容驗證。
生機盎然的內容驗證業
有趣的是,隨著造假者與偵探之間貓捉老鼠遊戲的加速,我們已經看到這個領域出現了一股騷動。尤其是Deepfake現象已經刺激了一波技術反擊的熱潮,最近已經被Axios的Kaveh Waddell概括過了。剛剛吸引到了路透社等1000萬美元投資的初創企業Truepic,已經把目光放在尋找類似眼睛反射率和頭髮位置之類的細節,這些在視訊成千上萬幀影象裡面想要作假幾乎是不可能的。Gif託管平臺Gfycat則利用了AI工具來檢查身份異常,並且將令人不快的視訊剪輯撤出網站。
在學術和研究領域,洛斯阿拉莫斯的卡學家正在開發演算法搜尋重複的視覺化元素,這是視訊操縱的指示器,而紐約州立大學SUNY Albany分校的研究人員已經開發出了一套系統,該系統可以監控視訊眨眼的嗎模式。與此同時,DARPA及其媒體取證團隊也在尋找AI生成的臉部的光線情況不一致的地方。
不過更令人棘手的是,標記那些假的和帶偏見的文字型新聞故事——那種內容很容易製作流入到社交媒體裡面也很容易。這裡不需要什麼技術花招,只需要一種古老的能力,編出令人信服地謊言,利用語言操縱讀者自身的偏見和情緒。也許出於這種原因,這些假故事似乎避開了機器檢測,往往需要直接的人為干預才能弄清楚。
在Cambridge Analytica 事件以及2016年美國總統選舉危機之後,Facebook儘管技術嫻熟,也得求助於跟一支越來越龐大的人類事實查驗師隊伍合作來審查平臺上的內容。由使用者(或者機器學習)標記為假的文章會被轉發到Facebook在全球14個國家的25家事實查驗合作伙伴那裡,包括Associated Press、PolitiFact以及Snopes等。反過來,被視為假的內容會被Facebook降級處理,也就是放到新聞流中較後面的位置,這會導致未來的瀏覽量下降超過80%。
這種人工的、零敲碎打式的辦法顯然還有許多待改進的地方:不同的事實核查組織的標準各不相同,甚至明顯假冒的故事在Facebook有機會將其降級之前可能已經流行起來。此外,規模的對比也令人沮喪:根據一項估計,k上面每60秒鐘就有510000條評論釋出,有136000張照片上傳。毫無疑問,不會有足夠的事實核查者來稽核所有假新聞的報告。
信任的未來
解決這個問題有沒有更好的辦法呢?必須有。辦法簡單嗎?不會。這裡就需要獨創性和市場機會形成合力了。比方說,我們能不能找到一種辦法利用域名權重(搜尋引擎排名分,可充當“信任度”的粗略代理)來審查在社交媒體上分享的內容?(比方說,像《紐約時報》這樣的渠道其域名權重為99/100,這樣的網站可以排名為高度可信。)這種辦法伸縮性強,但是,必須承認的是,遠談不上完美,因為域名權重基本上是基於回鏈(linkback)而不是事實正確性。
或者我們能不能從HTTP協議那裡找到線索?瀏覽器位址列旁邊的可靠的加鎖符號提供了即時保障,說明我們正在瀏覽的這個網站(比如銀行或網店)是安全的,我們的敏感資料是安全的。不難想象這個概念在內容世界裡面會是多麼的有用:我構思的是給被驗證為真且實時準確而不是假冒的視訊、照片和故事加蓋一枚精美的勳章。挑戰是HTTPS不過是加密的保證罷了。確保資料準確性是一個棘手的問題,而且從技術和人的角度來看也要複雜得多。
那區塊鏈呢?將不可篡改的總賬存在雲端,對所有內容追根溯源,這想法聽起來絕對很有吸引力。使用者可以比較視訊或者影象的版本,看看是不是修改了,而水印可以充當質量的印記。(的確,這個基本上是Truepic app背後的思路。)不過在這裡,問題依然是這個辦法能否應用到文字型的內容上,因為其欺騙意圖留下的技術痕跡很少。
所以,綜合內容驗證想象起來要比實現容易得多。曾幾何時,我們有過一個相當好的體系來解決這個問題——它的名字叫做新聞業。儘管存在種種限制和瑕疵,但新聞渠道對特定準確率標準的渴求,專業人士傾其一生去捍衛它的表現,這些都很好地應對了問題。網際網路和社交媒體已經侵蝕了傳統編輯看門人的角色。現在任何人都可以發新聞了。任何人都可以傳播虛假資訊。任何都可以進行誹謗。而隨著複雜的新聞工具的擴散,幾乎任何人都可以建立一個令人信服地虛假現實。
但是我依然樂觀。數字經濟(這個東西日益只有經濟而已)的骨幹是資訊交換。當這一資訊失去了可驗證性時,將會產生巨大問題……以及巨大的商機。內容驗證是一個有待填補的真空,說不定還代表著下一波數字化浪潮之一。
原文連結: https://www.fastcompany.com/90236068/is-content-validation-the-next-growth-industry
編譯組出品。編輯:郝鵬程。