揭祕Google Brain:專注糾正演算法錯誤/解決AI偏見
[ 摘要 ]谷歌的AI團隊在世界各地的人道主義問題上所做的工作是他們最自豪的成就,比如能夠預測洪水和地震餘震的系統。
騰訊科技訊 1月29日訊息,據外媒報道,用谷歌執行長桑達爾·皮查伊的話說,對於負責推進“比電或火更具有深刻意義”的人工智慧(AI)技術的人來說,傑夫·迪恩(Jeff Dean)是個非常冷靜的人。
作為這家科技巨頭的AI主管,迪恩負責領導的部門對谷歌的未來至關重要。即使在今年達沃斯世界經濟論壇的狂熱氣氛中,迪恩仍在禪修。顯然,這樣艱鉅的任務並未令他感到不安。
谷歌人工智慧部門主管傑夫·迪恩(Jeff Dean)
迪恩在谷歌成立之初的使命,就曾幫助應對“幾乎可以肯定”來自外太空的威脅。
太空射線
早在世紀之交,谷歌的搜尋引擎就開始出現故障,而其程式設計師卻對這一原因感到迷惑不解。正是迪恩及其密友桑傑·格瑪瓦特(Sanjay Ghemawat)診斷出了外太空問題。
迪恩解釋說,谷歌搜尋服務在廉價的硬體上執行,“它們就像是用打包電線和口香糖捆綁構成的”,因此它容易受到“極低概率事件”的影響。
迪恩稱:“來自外太空的特定射線會進入地球,並擊中存裝置的儲存單元上,將0或1翻轉為1或0。如果有人正在處理大量資料,這種情況尤其糟糕,因為突然之間,資料中有些隨機位將被翻轉和損壞。”
他補充說:“目前大多數機器都有類似問題的硬體保護措施。但是,谷歌早期使用的機器並沒有真正做到這一點。”
然而,近年來,谷歌的尖端機器吸引了迪恩的全部關注,而該公司大膽命名的“Brain Team”也是如此。這個團隊的使命是“使機器智慧化,改善人們的生活”。即使目前谷歌的人工智慧應用更顯平淡無奇,這一使命也令人覺得雄心勃勃。
機器學習使谷歌使用者能夠通過搜尋照片中出現的物件(例如,通過鍵入Cake或Cat)來檢索照片,而且機器學習也是語音識別工具的開發基礎,語音識別工具可以將多種語言的音訊轉換為文字。
谷歌的翻譯工具是其AI團隊的另一個成功之處,但也提供了一個早期的例子,說明演算法可以“向現實世界學習,而不是向我們希望的世界學習”。
與偏見作鬥爭
迪恩解釋說,當一個演算法被輸入大量文字時,它將自學如何識別通常組合起來的單詞。
迪恩稱:“舉例來說,你可能知道這樣的問題,即演算法經常將醫生更多地與‘他’而不是‘她’聯絡在一起,而將護士更多地與‘她’而不是‘他’聯絡起來。但你也會知道,外科醫生與手術刀有關,木匠與錘子有關。因此,這些演算法的優點在於,它們可以學習這些型別的模式和相關性。”
迪恩表示,這項任務是找出你想讓演算法找出哪些偏見,而他的團隊和AI領域的許多人都在努力探索這背後的科學。迪恩稱:“很難說我們是否能找到完美的無偏見演算法。”
職業社交網站LinkedIn創始人艾倫·布魯(Allen Blue)
公司努力解決這些問題的一個令人驚訝的例子是職業社交網站LinkedIn。當其5.62億使用者登入到自己的賬戶上時,他們會得到關於工作和聯絡人的獨特建議,而這些都是由AI提供支援的。更重要的是,使用LinkedIn的招聘人員會收到一份經過機器學習篩選的理想候選人名單。
但LinkedIn聯合創始人艾倫·布魯(Allen Blue)很快就發現了這個過程中存在的一個問題,即女性在入圍名單上的排名還不夠高。布魯說:“我們所能做的就是說:‘好吧,我們會糾正這個演算法。這樣它就能以與實際匹配搜尋標準的同等比例篩選男性和女性候選人,並對他們進行排序,以確保這些女性不會意外地被漏掉。”
更多樣性
但布魯承認,解決這個問題只是AI冰山的一角。他解釋說:“我們剛剛達到這樣的水平,即理解了如何以最好的意圖構建一種機器學習演算法,但仍然無意中在結果中引入了偏見。”
布魯最喜歡引用的例子是面部識別技術。他稱:“第一個版本面部識別應用的訓練物件是名人照片,這些名人大多是白人和男性,這意味著白人男性的面部識別準確率可達97%,而非洲女性的準確率僅為3%。”他認為,如果不增加AI演算法構建者的多樣性,就不可能有任何補救辦法。
早期對面部識別的嘗試遇到了偏見問題
布魯說:“當我們觀察LinkedIn上真正擁有AI技能的人時,只有22%的人是女性。” 更糟糕的是,他補充說:“女性的角色傾向於更注重研究,或更傾向於教學,而男性的角色更傾向於領導。”
布魯承認:“每個人都有偏見,但如果女性不在這個方面提供幫助,我們就不能完全理解人們是如何設計AI的。”
儘管有這些警告,但當談到AI的潛在積極作用時,布魯和迪恩都顯得熱情洋溢。在談到招聘過程時,布魯認為,計算機甚至可以教會我們如何消除人類的缺點。
洪水和地震
布魯稱:“當你走進去與某人面對面交談時,你會得到很好的情緒解讀,或從他們身上獲得能量亦或是其他什麼,這是建立在你的特質基礎之上的,因此對於怎樣才能成為好員工的觀點是存在偏見的。AI可以幫助你從一種消除偏見的觀點中分離出那種良好的感覺,這就是我所說的純粹的機器與人類協作的意思。”
對於迪恩來說,谷歌的AI團隊在世界各地的人道主義問題上所做的工作是他們最自豪的成就,比如能夠預測洪水和地震餘震的系統。
資料隱私是今年達沃斯世界經濟論壇的熱點問題
特別關注醫療保健和生物科學幫助催生了一種工具,它可以從視網膜影象中診斷一種叫做糖尿病視網膜病變的疾病,而不需要眼科醫生介入。
迪恩在世界經濟論壇上對AI的這些用途始終稱讚有加。在這次論壇上,諸多會議都集中討論了資料隱私和對技術的監管問題。
就谷歌而言,迪恩相信,該公司的內部原則將有助於防範AI的潛在濫用問題,並透露,他的團隊“肯定決定不公佈我們認為可能會產生負面影響的某些成果”。
但迪恩說,防止濫用機器學習的方法是吸引合適的人類來該領域工作。他表示:“我們需要更多的人研究這類領域,更多的人對這些領域感到興奮,因為這就是我們取得進步和解決社會許多問題的方式。”(騰訊科技審校/金鹿)