人有多大膽，流量多高產：網際網路世界中的花式資料造假秀 |德外獨家

· 發表 2019-04-09 11:19:55

摘要：編者按：本文來自微信公眾號 “德外5號”（ID：dewaiwuhao），來源：TheDrum，作者：Samuel Scott，編譯：王金喜，36氪經授權釋出。資料造假問題充斥著整個網際網路世界。從國內主流視訊網站不堪刷資料之擾，而主動關閉視訊播放量，到前陣子被央視曝光、鬧得沸...

編者按：本文來自微信公眾號 “德外5號”（ID：dewaiwuhao），來源：TheDrum，作者：Samuel Scott，編譯：王金喜，36氪經授權釋出。

資料造假問題充斥著整個網際網路世界。從國內主流視訊網站不堪刷資料之擾，而主動關閉視訊播放量，到前陣子被央視曝光、鬧得沸沸揚揚的流量明星微博資料造假問題，數字世界中的真實和虛假，越來越撲朔迷離。事實上，國外的網際網路媒體巨頭也無法倖免，同樣深陷資料造假的泥潭。

Reddit前執行長Ellen Pao曾在Twitter上發文抨擊網際網路世界中的資料造假現象：一切都是假的（這卻是個真的不能再真的事實）。比如手機使用者人數。從在Reddit工作的經驗來看，統計使用者人數時，一般無法排除掉那些已登出手機號碼的使用者。

漏洞無處不在，比如，只要使用者切換一下手機訊號塔，後臺的統計軟體就會把他誤認為是另一位新使用者，然後就可以無節制地誇大自己的使用者總人數。

在大洋彼岸的中國，網際網路新貴們也在上演著轟轟烈烈的資料造假運動。

不論是各種視訊播放量中動輒連起來能繞地球N圈的總數字，還是音樂榜單中火速躥升但國民度知曉度幾乎為零的最“熱”單曲，亦或是給人感覺全中國的手機使用者每時每刻都“線上”的APP日活、月活人數，這把資料造假的熊熊大火，在中文網際網路世界中也在肆無忌憚地燃燒著。

曾幾何時，人們對數字世界寄予厚望，認為數字世界裡的一切事物都真實可信、可測量、可追蹤。但實踐證明，這可能只是人們一廂情願的想法。事實上，我們現在在網路上看到的很多東西，都可能是徹頭徹尾的謊言。

眾言堂與一言堂：傳統媒體VS網際網路新貴

傳統媒體時代，因為所有的資料都要接受獨立的第三方機構稽核，所以報紙、雜誌、電臺廣播公佈的讀者/聽眾人數很難作假，電視則更進一步，在統計節目觀眾人數時，甚至會考慮那些在廣告時間不上廁所而蹲在電視機面前認真看廣告的觀眾人數佔比。

雖然也會零星出現一些假資料醜聞，但總的來說，傳統媒體時代絕大多數的受眾統計資料都是真實準確、值得信賴的。

但當我們把目光轉向網際網路媒體，就會赫然發現，我們掉進了網路媒體公佈的各種難辨真假的統計資料漩渦之中。

“一言堂”現象在網際網路媒體中普遍存在，比如Facebook、谷歌這些網際網路領域裡的“老大哥們”，從不允許獨立的第三方機構審計它們的資料。也就是說，它們說什麼就是什麼，說多少就是多少，至於這些統計資料中都包含了多少水分，我們無從得知。

差之毫釐，謬以千里：網路流量分析的侷限性

當我們開啟像“谷歌分析”這樣的分析軟體，去觀察和分析網路流量的分佈（訪客人數、轉化率、銷售額以及其他資訊）時，你有想過這些流量分析資料都是怎麼統計出來的嗎？

一般的方法是，這些流量分析軟體，將一段程式碼植入到網站中，當用戶通過瀏覽器載入某個網頁時，程式碼會在瀏覽器中啟用cookies來對使用者在網頁上做了什麼進行記錄。但當用戶使用一些攔截器軟體或者外掛時，這些專門用來蒐集使用者行為資料的cookies就會紛紛啞火。

事實上，習慣於用各種攔截器阻斷cookies工作的網民人數已經越來越多。一份調查顯示，英國網民中，上網時開啟攔截器的網民人數佔比高達五分之一以上（22%）。

也就是說，每5個英國網民中，就有1個網民的上網行為無法被準確測量。現行的網站流量分析工具往往對這部分使用者束手無策，在最終呈現的分析結果中也不展現這部分人的測量結果，可想而知這些網路流量分析結果的準確性和代表性了。

如果企業的營銷決策是基於這些殘缺、不充分、代表性不足的使用者行文分析資料，那很可能在戰略規劃層面上就已經跑偏了。

更要命的是，越來越多的分析人士發現，看似客觀、“濃眉大眼”的網路流量居然也會作假。分析人士認為， 目前機器人水軍貢獻了大約50%的網路流量。 只要錢花到位，任何網站的流量資料都可以刷出來。這麼推算下來，這些流量分析軟體最後呈現出來的分析結果中，至少有一半的數字都是不可信的。

人有多大膽，流量多高產：中外網際網路媒體中的花式資料造假秀

1. YouTube

視訊類網站，尤其是社交視訊類網站，往往是這個問題的重災區。因為播放量越高，該視訊的排名就越靠前，博主的名氣就越大，這是成為網路大V的先決條件，也是吸引廣告主重金達成合作的前提和依據。而花錢刷播放量則是最輕鬆的捷徑，於是大家都開始對這種作假行為趨之若鶩。《紐約時報》最近調查發現，只要15美元，就能在YouTube上購買5000個虛假視訊播放量。而加拿大的一位網民，通過售賣1500萬次YouTube虛假點選量，在2018年狂攬20萬美元的收入。

但比起容易被網站識別出來、略顯笨拙的機器人刷量行為，在刷播放量這條路上，國內反而另闢蹊徑，摸索出了一條“人工刷量”的新路徑，並形成了規模不小的產業鏈。就像在工廠做工一樣，花錢僱來的真實的網民，會在整個工作日中按要求反覆觀看相同的視訊、訪問相同的網站和下載相同的APP。這種由“真人模擬真人”的新方法，甩那種簡單的“機器人刷量”好幾條街，讓人大開眼界。所以下一次再看到讓人驚掉下巴的點選量和播放量，一定要冷靜地想一想，這其中究竟有多少是機器人貢獻的？又有多少是“真人模擬”貢獻的？

2. 亞馬遜 VS馬蜂窩

BuzzFeed News曾指出，在亞馬遜上寫一篇某款耳機的好評，可以獲得36美元的酬勞。而這絕對不是孤例，在 Facebook上，有數百個群組、上萬名成員對電商評論這塊肥肉虎視眈眈 ，密謀著如何買賣亞馬遜上的商品評論。 這些是否說明，一條出自陌生人之手的好評，到底有多大的參考價值？更大的實錘來自《華盛頓郵報》，該報調查發現，亞馬遜上關於電子產品的線上評論中，有61%都是虛假評論。其他類似的使用者評論網站（如Airbnb、Yelp等）中，也有不少類似情況發生。

反觀國內，淘寶和京東上屢禁不止的有組織水軍刷好評，已經讓人們見怪不怪了。在2018年10月20日，知名旅遊攻略網站馬蜂窩“被捅”一事更是讓人記憶猶新。有人通過爬取馬蜂窩上的使用者評論資料進行分析後，發現這家估值一百多億的網際網路獨角獸的2100萬條“真實評論”，竟然超過半數是馬蜂窩官方通過機器人從大眾點評、攜程、藝龍等競爭對手那裡直接拷貝過來的。甚至餐飲方面的評論內容還直接從國外知名評論網站Yelp中進行搬運，通過谷歌翻譯進行偷樑換柱後，變成了自家平臺的原創評論內容。

（馬蜂窩虛假使用者發表評論的時間點與上班時間完美契合來源：公眾號“小聲比比”）

此錘一出，四下譁然，馬蜂窩被各路網友犀利毒辣的調侃噴成了真馬蜂窩。而這還只是冰山一角，“馬蜂窩被捅”事件只不過是將人們先前早已有所耳聞的網際網路公司資料造假現象，再一次赤裸裸地給曝光了出來。其實馬蜂窩先前的口碑一直良好，可想而知其他口碑差的類似公司的資料造假有多厲害了。

3. Twitter VS 微博

如何快速漲粉？——買就對了！

《紐約時報》做了個小實驗，它設立了一個虛假的Twitter賬號，在花了225美元后，這個虛假賬號漲了2.5萬名粉絲。筆者此前在經紀公司工作時，也曾應客戶要求，花錢為客戶的Twitter賬號漲粉。而美國兩所大學的研究也發現，目前高達15%的Twitter賬戶都是機器人，筆者認為，實際的機器人佔比可能比15%還要高。

所以， 粉絲人數可以花錢買來，簡直是社交媒體上公開的祕密。 問題的癥結在於，品牌主往往依只據粉絲數量來判定某個博主是否有商業價值，所以為了快速漲粉，營造自己人氣很旺粉絲眾多的假象，博主們往往在購買粉絲方面捨得下血本，羊毛出在羊身上，最後的冤大頭還是那些為了更好看的粉絲數量而大手筆投入營銷預算的品牌主們。

作為國內對標Twitter最成功的網際網路產品，微博上的資料造假現象也普遍存在。以前陣子被央視曝光的流量明星為例，有人抓取2018年微博的資料進行分析後發現，2018年全年整個微博平臺轉發量最高的10條，全都出自蔡徐坤，總計轉發量達到4.41億次，相當於三分之一的中國人口。也就是每三個中國人，就有一位轉發過蔡徐坤發表的微博。可事實果真是如此嗎？

（蔡徐坤轉發量最高的幾條微博來源：公眾號“小聲比比”）

更直觀的對比來自2018年10月。藝人馮紹峰和趙麗穎結婚，官宣當天微博伺服器就又雙叒叕開始宕機了，然而這條官宣微博的轉發量也不過才500萬而已。而一些流量明星的微博轉發量動輒飆升至千萬量級，可微博伺服器卻照常運作，足見轉發量資料水份很大。借用網友的一句玩笑話就是，如果是真人在轉發，就算他們轉到雙臂淤青，也刷不出這麼高的轉發量來。這背後必然是專業的機器人程式+專業化人工刷量在共同“努力”。

4. Instagram

Instagram上有的KOL在營銷做假，矇在鼓裡的品牌主也會受損失。

Points North Group發現，與麗思卡爾頓酒店合作的網路大V中，79%的粉絲都是假的。而根據Captiv8的估計，品牌與擁有10萬粉絲的網路大V合作，需支付2000美元成本；但《紐約時報》購買2.5萬名粉絲只需要225美元。推算一下，購買10萬粉絲，也就花費900美元。但品牌主卻對網路大V付出了2000美元的代價，網路大V購買假粉絲，確實是個穩賺不賠的生意。

5. Netflix

這是個“一言堂”式公佈使用者資料、缺少獨立第三方機構進行稽核的典型例子。

首先，我們該怎麼確認Netflix公佈的使用者人數沒有水分呢？無法求證（攤手.JPG）。

其次，Netflix宣稱，高達4500萬“Netflix賬號”“ 觀看”了電影《Bird Box》。打住！“賬號”是什麼意思呢?4500萬“賬號”就代表4500萬觀眾嗎？因為現實生活中多個人共享一個Netflix賬號也是常有的事，那這部分觀眾怎麼計算呢？而Netflix宣稱的“觀看”，到底指代的是“看完整部電影”，還是“只看開頭一秒”，抑或是“只看到電影中間的某個時間段”？同樣無從得知。

6. Facebook

作為“人紅是非多”的典型代表，最近一直醜聞纏身的Facebook的資料造假現象更是由來已久。早在2016年9月， Facebook就曾承認平臺在兩年內以虛增60%—80%的方式，誇大了Facebook中的視訊平均瀏覽量。同月，知名市場調研公司資料顯示，由於資料報道方式的修正，Facebook在澳大利亞的視訊流量暴跌了94%。

同樣是在2016年，Facebook掌門人扎克伯格公開表示“5年之內所有一切都將轉向視訊”。結果日前有訴訟稱Facebook 將視訊廣告的瀏覽量故意誇大了900%。 對當初許多聽信扎克伯格的言論，紛紛押寶網際網路視訊的媒體公司來說，並不是個好訊息。

Facebook中還有所謂“每日活躍使用者”指標，該指標主要用於“觀看類”產品上。只要使用者每天在Facebook上花費時間超過一分鐘，那麼他就是平臺上的“活躍使用者”，但有意思的是，這60s可以不是連續的60秒鐘，也就是說——如果某個使用者在60個視訊中分別觀看1秒鐘，那他也算是一個活躍使用者。嚴格意義上來講，Facebook的這一指標本身就是一個虛假指標，因為在測量電視節目的“收視率”時，前提之一便是觀眾是否連續觀看超過60s。

另外，Facebook上更嚴重的問題是虛假新聞和廣告宣傳。這一問題更加嚴峻，因為它已經開始危害公眾利益了。以一直存在較大爭議的脫歐公投為例，很有可能一些外國敵對政府和不法分子在最後時刻通過在Facebook上釋出虛假新聞、虛假頁面、虛假廣告和成立虛假團體，來鼓動網民倒戈，最終實現他們的脫歐目的。

7. 使用者參與

對於操縱“使用者參與”這種行為，可以說防不勝防。“點贊”、“分享”，是時下判斷使用者參與情況的主要指標，品牌主往往也根據這幾類指標來對某個線上營銷活動的效果進行評估，可是，這些“使用者參與”的判斷指標，做起假來更變本加厲。網際網路世界中存在著大量的第三方小機構在叫賣提升類似觀測指標的服務。反欺詐公司Sway Ops分析了一天中Instagram上標記為“贊助”或“廣告”的帖子，發現這些帖子中超過50%的使用者的參與行為都是虛假的，只有18%的帖子評論是由真人釋出的。

8. 廣告展示次數

別再天真地認為，網際網路上的“廣告展示次數”的數字代表了有多少人觀看了這一廣告。事實上，“廣告展示一次”，代表的僅僅是瀏覽器（機器人程式）請求網路廣告伺服器載入了一次廣告而已，很可能並沒有真人在看這些網路廣告。如果有一半的網路流量是假的，那麼據估計最終廣告展示次數中也有一半是假的。

9. APP裝機量：

2018年，研究人員發現有11%的APP裝機量是假的，比2017年增加了30%。測量公司Adjust對17天內發生的4億次APP安裝流量樣本進行了分析，最後發現，支付給虛假安裝APP的“假使用者”的營銷費用預計高達170萬美元。

對於以上的更種花式資料造假，《華盛頓郵報》廣告技術總監Aram Zucker-Scharff的觀點則更為激進：

“這些數字都是假的！各種指標也在胡扯！真正在認真做事的廣告代理機構都知道，網際網路上的騙子們在對資料進行造假並從中牟利，他們搗鼓出來的一眾模型裡沒有一個能在大規模的使用者人群上適用。問題的關鍵不在於充斥在網際網路上的各種虛假、扯淡、亂七八糟的數字，各種失靈的觀測指標和信口開河的騙子，最根本的問題在於，網際網路上的所有虛假的東西都是疊加在其他虛假東西之上的，這隻會讓網際網路這趟渾水更加複雜和渾濁。網際網路上所有虛假的廢話、虛假的號碼、虛假的模型、虛假的資訊以及虛假的使用者，都不是偶然現象。”

一視同仁，重拳出擊：營銷行業應該怎麼做？

1. 只認可經過獨立第三方機構審計過的各類資料，拒絕接受Facebook、谷歌或其他網際網路媒體主動披露給大眾、帶有自吹自擂嫌疑的資料。

2. 要對傳統媒體和網際網路媒體一視同仁，採用同一套度量標準和觀測指標。核心原則就是對線上線下多個渠道的營銷效果進行對比分析，然後選擇效果最佳的那個。以直接反應營銷（直複式營銷）為例，直接反應營銷的主要觀測指標是ROI（投資回報率），那麼就可以在直郵、電子郵件、Google AdWords和其他適合的渠道中做對比實驗，分析每個渠道的支出成本和最終回報，選定表現最好的那一個。不可否認，在直接反應營銷領域網際網路媒體的優勢很大，相比於傳統媒體渠道，它非常高效，但我們始終要牢記的是，高效並不等於有效！

3. 黑貓白貓，抓到老鼠就是好貓，所以營銷人員請別再糾結於如何區分所謂的“傳統營銷”和“數字營銷”了，事實上，營銷就是營銷，無所謂線上線下之分。在管理營銷部門時千萬不要將線上線下劃分成兩個部分。應該根據營銷策路進行有效劃分。

在傳統媒體時代從沒人整天叫嚷著什麼“電視營銷”，所有的傳統媒體都是通力合作，整體服務於整個營銷策略的。所以今天網際網路上大肆鼓吹的什麼“社交媒體營銷”、“視訊營銷”，都是片面的說法。

具體的做法，比如，成立專門負責直接反應營銷團隊、專門的廣告團隊和專注於公關事宜的團隊，讓他們認真思考如何更好地對線上線下這些渠道進行優化整合，完成相應的營銷任務。重點放在營銷策略上，而不是糾結在渠道上。營銷人員更擅長的其實也是營銷戰術。切記“渠道中立”原則，而不要一味擁抱“唯數字化”或者“優先數字化”這樣的愚蠢觀點。

正如BuzzFeed新聞媒體編輯Craig Silverman所言:“是時候重拳出擊，打擊網際網路上的一切作假行為了。”