我們一直都在接受A / B測試
網路正在被無處不在的實踐所重塑 - 這是一個嚴重的道德問題
Testing出的解決方案是設計過程的核心部分,並且在網路上,即經常發生在A / B測試的形式:設計師展示一組設計給A使用者,另一組設計給B使用者,並測量它可以獲取更接近期望的結果。並且不僅僅是測試A / B的佈局 - 這些實驗決定了從我們閱讀的標題到我們看到的顏色的 所有內容。
但正如一篇新論文所 討論的那樣,A / B測試可能存在道德問題。
研究演算法審計的東北大學副教授Christo Wilson說:“如果你不瞭解內容是如何變化的,或者佈局如何以影響你行為的方式發生變化,那麼就會讓你受到操縱。” ,以及該論文的作者,“這是A / B測試的重點。您正試圖銷售更多產品或獲得更多點選次數。”
在年度ACM公平,問責和透明度會議上發表的論文中 ,Wilson和他的合作者分析了575個在Optimizely 平臺上執行A / B測試的大型網站,這使得非技術人員相對容易以各種方式使用A / B測試。在該論文中,威爾遜深入研究了三個具體的案例:廣告,價格歧視和新聞頭條。雖然他不會責怪任何公司或用於不道德地應用A / B測試的案例,但威爾遜確實利用這個機會闡明公司如何使用這種經過深思熟慮的技術來改變人們在網際網路上看到的內容,無論是價格,廣告,頭條新聞或佈局。
問題在於,當它沒有以透明,負責任的方式完成時,A / B測試可以利用人類心理學中最糟糕的衝動來說服你點選某些東西。例如,當談到政治內容時,那種聳人聽聞的行為
我們中的許多人可能認為我們在網路上瀏覽時看到的東西是一樣的,但事實並非如此。要檢視你訪問的任何執行A/B測試的一個網站,你可以下載一個名為Pessimizely的Chrome瀏覽器外掛,它將顯示出Optimizely所能提供的一切便利,從廣告客戶嘗試向你展示哪些廣告,到《紐約時報》(New York Times)測試不同的標題。
Wilson的分析表明,目前大多數使用A / B測試的網站都是網際網路上最大的網站。並且它可能變得更加普遍:使用Optimizely等工具可以幫助小公司獲得公平的競爭環境。“我希望看到較小的網站能夠與較大的網站競爭,所以如果A / B測試是一種方法,那就是好的。我很高興技術水平較低的人擁有先進的能力 - 它不應該只是谷歌和Facebook,“他說。“另一方面,我只是擔心會有更多未受過訓練的人在大量觀眾面前進行實驗。”
在廣告方面,不道德用途的可能性尤其令人痛苦。例如,假設您在男性主導的行業中為高薪工作釋出了兩個廣告。一個包括刻意的男性性別印象,另一個是性別中立。A / B測試可能會向您顯示更多人點選該性別廣告。這會讓你確信顯示該 廣告給更多的人。但是,點選該廣告的所有人都可能是男性,導致適用於該工作的人口偏差。看到這些廣告的人可能不知道背景中發生了什麼。
“我們觀察到Optimizely被許多非常受歡迎的網站使用,”研究人員寫道。“但是,據我們所知,這些網站的訪問者從未被要求明確同意這些實驗。即使是實驗的存在也很少被披露。“
價格歧視是您在網上看到的內容可能與其他人看到的不同的另一個例子:例如,A / B測試可能有助於優化不同郵政編碼中的人的價格,但人們居住的地方往往與他們的種族交織在一起,可能導致基於種族的定價 。
威爾遜認為,需要有更嚴格的指導方針來進行這些實驗。“我並不是故意把所有這些描繪成邪惡的,”他說。“但我們必須承認這些都是人體實驗。你正試圖改變人們的行為。如果我作為大學的科學家那樣做,那就是協議。你不能只是試驗人。“
有一些簡單的方法,像Optimizely這樣的公司和A / B測試平臺可以更清楚地瞭解這些測試協議,這對於科學家來說是典型的。威爾遜設想一個內部公司審查委員會,確保測試不會無意中造成損害,以及公司可以與合同審查研究計劃的外部服務。一個已釋出指南的行業貿易組織也可以幫助甚至從Optimizely等平臺進行更多培訓。他認為這些指導方針與學術界存在的指導方針類似,有關於尊重人,尊重自主權和善行的規則 - 為他人的利益行事的義務。
“這非常重要,因為這些工具非常易於使用,”Wilson說。“但它必須附帶一系列警告。如果你要做一些像價格歧視這樣的事情,這可能是一個嚴重的事情。你是以公平公正的方式對待別人,還是隻是忽略了這一點,說我關心的只是推動點選?“
更多文章歡迎訪問: http://www.apexyun.com
公眾號:銀河系1號
聯絡郵箱:[email protected]
(未經同意,請勿轉載)