直面演算法霸權:我們該如何應對
我們正在進入一個“演算法”的時代。它對我們生活的影響越來越大——我們去哪裡上學,我是不是應該貸款買車,我們應該花多少錢來買健康保險,這些都不是由人來決定的,而是由演算法、由模型來決定的。
我們被告知:通過大資料的精準畫像,演算法可以讓企業更好地識別我們的偏好,從而更好地向我們提供商品和服務。由於演算法對每一個人的衡量標準是一樣的,因此它可以排除很多不必要的偏見。 總而言之,演算法可以讓整個社會的執行變得更高效、更公平、更美好。
但是,在凱西·奧尼爾在新書《演算法霸權》中,卻告訴了我們一個完全不同的故事。在奧尼爾的故事裡,演算法並沒有帶給人們它所承諾的美好。 相反,它可能破壞這個社會所賴以良好執行的基礎,讓它變得既不公平,也沒效率。
一、演算法如何施暴?
和很多演算法的批判者不同,凱西·奧尼爾本人其實就是一個演算法“圈內人”。她自小開始就對數學十分敏銳,在大學期間更是以數學作為專業。從哈佛大學獲得博士學位後,她曾在巴納德學院任教,後來又以資料科學家的身份輾轉於金融圈和實業界,為很多知名企業提供過演算法和資料方面的諮詢。
豐富的經歷讓奧尼爾得以熟諳各類演算法的精髓,也對其中蘊含的危險瞭如指掌。由於這個原因,相比於其他同類著作,《演算法霸權》對演算法的批判就來得更真實,也更可信,也更富有洞見。
那麼,演算法究竟會有哪些問題呢?
首先,演算法可能並沒有像人們通常想象的那麼準確。很多基於大資料的演算法本來是用於分析整體的屬性的,在這種條件下它們可以比較好地工作。正如奧尼爾在書的一開始中所舉的棒球隊的例子那樣,通過大資料演算法,球隊可以大幅提升自己的成績。
但是,一旦這樣的演算法被應用到了評估個體上,就會馬上發生問題。例如,書中提到了用演算法評估教師質量的問題。由於每一個教師每年教授的學生都是有限的,因此極個別的異常點就可能導致評估結果的重大變化,這讓一些優秀的教師被誤判為不合格。更為重要的是,當被評判的教師瞭解了評判的標準時,就可能針對這些標準有意識地進行造假,從而讓原本有效的演算法很快失去了效力。
其次,演算法本身可能就蘊含著歧視性。很多演算法在設計的時候只考慮了相關性,而沒有考慮因果關係,這讓它們在表面公正的背後,蘊含了對部分人的歧視。例如,曾經有統計表明,黑人進行犯罪的概率會更高,這個統計結果曾影響了美國司法數十年,讓黑人在審判中難以得到像白人一樣的權利。
然而,這個判斷本身其實掩蓋了真正的因果關係。事實上,黑人在很多方面都難以享受到和白人同樣的待遇,他們難以接受和白人一樣的教育、難以找到和白人一樣的工作……在很大程度上,黑人的高犯罪率正是這種不平等的結果。因此,如果以這高犯罪率為理由,對黑人進一步施加歧視,結果只可能會讓他們的犯罪率進一步提升。
需要指出的是,演算法的歧視性很難反駁,因為它們往往會自我實現。例如,例如在上面的例子中,對黑人的歧視讓他們的犯罪率更高了,這是令人沮喪的,但從表面上看,這又恰好印證了演算法的預言。在這樣的事實面前,我們似乎很難對演算法提出質疑。
再次,演算法的精準也可以成為損害福利、製造不公正的工具。一個例子就是精準推送的廣告。從理論上講,精準廣告是可以幫助改善人們的福利的——通過對人們特徵的識別,演算法可以更好地識別其個體的偏好,在此基礎上的推送可以更符合他們的口味、更滿足他們的要求。
但這裡有一個重要的問題,那就是在很多時候,人們並不知道自己真正想要什麼,也不知道什麼是對自己真正有用的。面對有針對性的廣告,他們的決策很容易受到誘導。
在書中,奧尼爾舉了一個大學招生的例子。在美國,有很多“野雞大學”,除了提供文憑,它們並不能真正為人們提供良好的教育。然而,這些“野雞大學”卻是營銷的高手,藉助演算法,它們把客戶群精準地集中在了那些收入和社會地位相對較低,但對改變現狀極為迫切的人的身上。從這部分人群身上,他們收穫了高昂的學費。但與此同時,那些繳納了學費的學員卻沒能得到他們期待的改變。
基於以上分析,奧尼爾認為,對於演算法和資料,我們不應該盲目樂觀,而應該持續保持警醒。
二、如何應對演算法霸權?
應該說,《演算法霸權》一書是十分發人深省的。書中提到的很多事例,其實我們每天也在經歷。在享受演算法帶來的便利的同時,我們其實也在不知不覺中忍受著演算法的霸權。
那麼,對於演算法,我們應該秉承一種怎樣的態度呢?我想起了《星球大戰》中的一段劇情:天行者盧克對原力陰暗面的強大破壞性深為恐懼,為了防止這種力量的濫用,他選擇了避世隱居。然而,原力帶來的破壞並沒有因此而停止,儘管以盧克為代表的正義一方放棄了對它的使用,但邪惡勢力卻一直在開發著它的價值。後來,盧克在雷伊的勸說下認識到了這點,挺身而出用原力維護正義,最終慷慨赴死。
在很多方面,演算法和“星戰”世界中的原力都存在著相似——它十分強大,能幫助人們達成很多原本難以達成的目標,但也能帶來很多原來難以想象的破壞,這一切都取決於如何對其使用。如果處於害怕而放棄對其的應用,那就好像是倒洗澡水時把孩子也倒了一樣,不僅無益於解決問題,還會消滅最終解決問題的可能。從這個意義上講,對於演算法,我們應該採取一種類似於“星戰”中盧克對待原力的態度——在承認其破壞性的同時,設法駕馭它,盡力做到揚長避短、趨利避害。
必須承認的是,目前我們對如何駕馭、監管演算法還所知甚少。例如,奧尼爾在書中提出了演算法要公開,要接受政府監督。用行內的術語,就是強調了演算法要有“透明性”和“可解釋性”。但其實,這兩點做起來並不簡單。
“透明性”要求演算法的編寫者將原始碼公開,以保證其可以被檢驗。這從理論上講可以,但在實際上,很多的演算法非常複雜,即使公開了也很難被檢驗。另外,不少具有獨創性的演算法都涉及到智慧財產權問題,因此直接空開演算法是比較困難的。在這些情況下,“透明性”如何被保證,依然是個棘手的問題。
“可解釋性”要求演算法的編寫者能向用戶解釋演算法是如何作決策的。但這事實上也很難操作。一般來說,演算法越精巧、越準確,其複雜性就越高,就越難以被解釋。因此,如果演算法的編寫者過於追求可解釋性,就勢必會以犧牲演算法的精巧和準確為代價,而這有時候是得不償失的。
當然,問題的嚴峻,並不代表著我們可以停止努力。事實上,現在已經有很多人開始投入到對演算法監管的研究上,並且已經取得了不少共識和成果。所謂“只要信心不滑坡,辦法總比困難多”。我相信,在人們的努力下,演算法一定會成為“大規模造福工具”,而不是“大規模殺傷性武器”。