AI最前線：谷歌使用密歇根大學的演算法檢測假新聞

演算法 · 發表 2019-02-13 14:16:46

摘要：密歇根大學研究人員開發了一種識別假新聞的算法系統ann arbor。它在正確識別假新聞方面比人類做得更好，在測試中它成功地發現了高達 76% 的假貨, 而人類的成功率為 70%。此外, 他們的語言分析方法可以用來識別假新聞文章, 這些文章太新了, 無法通過將其事實與其他故事相互參照來揭穿。該系...

密歇根大學研究人員開發了一種識別假新聞的算法系統ann arbor。它在正確識別假新聞方面比人類做得更好，在測試中它成功地發現了高達 76% 的假貨, 而人類的成功率為 70%。此外, 他們的語言分析方法可以用來識別假新聞文章, 這些文章太新了, 無法通過將其事實與其他故事相互參照來揭穿。

該系統已經被Google News等網站用於打擊虛假新聞。

專案組的 u-m 電腦科學和工程教授Rada Mihalcea 表示, 對於那些難以應對假新聞衝擊的網站來說, 自動化解決方案可能是一個重要的工具。

在假新聞產生真正後果之前抓住假新聞可能會很困難, 因為今天的聚合者和社交媒體網站嚴重依賴人類編輯, 他們往往跟不上新聞的湧入。此外, 目前的揭穿技術往往依賴於對事實的外部驗證, 而最新的故事可能會很難研製。通常情況下, 當一個故事被證明是假的時候, 傷害已經造成了。

語言分析採用不同的方法, 分析可量化的屬性, 如語法結構、詞的選擇、標點符號和複雜性。它的工作速度比人類快, 可以與各種不同的新聞型別一起使用。

"你可以想象, 在新聞或社交媒體網站的前端或後端, 有多少這樣的申請。"系統可以為使用者提供個人故事或整個新聞網站的可信度估計。這可能是新聞網站後端的第一道防線, 支援進一步審查可疑報道。76% 的成功率留下了相當大的誤差, 但當它與人類一起工作時, 將極大提升工作的效率和效果。

Mihalcea 說, 分析書面講話的語言演算法在今天相當普遍。構建假新聞探測器的挑戰不在於構建演算法本身, 而在於找到合適的資料來訓練該演算法。

假訊息很快就會出現和消失, 這就很難收集到。它還有許多型別, 使收集過程更加複雜。例如, 諷刺新聞很容易收集, 但它的諷刺和荒謬的使用, 使得它在訓練假新聞檢測方面的演算法時沒有那麼有用。

最終, Mihalcea 的團隊建立了自己的資料, 眾包一個在線團隊, 將反向驗證的真實新聞故事轉化為假貨。

研究人員在Amazon Mechanical Turk的幫助下被招募, 他們被僱來將簡短的、真實的新聞報道變成類似但假的新聞。然後, 他們將這些標記的訓練資料提供給一個進行語言分析的演算法, 教授則自己區分真實新聞和假新聞。最後, 研究小組將演算法轉向了直接從網路上提取的真實和假新聞的資料集, 獲得了 7 6% 的成功率。

新系統的細節和團隊用來構建它的資料集是免費提供的, Mihalcea 說, 它們可以被新聞網站或其他實體用來構建自己的假新聞檢測系統。她說, 未來的系統可以通過納入元資料, 如與特定線上新聞專案相關的連結和評論, 進一步磨練。

https://news.umich.edu/fake-news-detector-algorithm-works-better-than-a-human/

宣告：本文來自malwarebenchmark，版權歸作者所有。文章內容僅代表作者獨立觀點，不代表安全內參立場，轉載目的在於傳遞更多資訊。如需轉載，請聯絡原作者獲取授權。

AI最前線：谷歌使用密歇根大學的演算法檢測假新聞

您可能也會喜歡…