獨角獸馬蜂窩:1800萬“真實點評”來自“抄襲”,大資料時代羅生門,警鐘為誰而鳴?
今天下午,邦哥被一篇名為《估值175億的旅遊獨角獸,是一座殭屍和水軍構成的鬼城?》的文章刷屏了。這篇文章的內容,主要是說旅遊獨角獸馬蜂窩宣傳中的2100萬條“真實點評”,有1800萬條都是通過爬蟲等手段,從其他平臺進行抓取的,而並非出自平臺使用者本身。
在文章中,作者用到的核心關鍵詞,是“抄襲”。並稱即便將標準設定為,一字不差的抄襲,才算抄襲,但仍然發現了7454個抄襲賬號,和相應的共計1793萬條抄襲點評。
不久後,馬蜂窩一位市場經理出面迴應,稱公司正在核實情況,他們同樣在等待結果:“暫時不知道什麼時候能出,不過今天應該是可以的。”
引發轟動的同時,邦哥在於一位從業者交流時,卻得到了不同的答案:“抄襲我覺得談不上吧,其實大家都是評論的搬運工,版權在使用者,使用者卻是最弱勢的群體。”
“網際網路公司,有幾個資料是真的?”
“其實平臺是沒有所有權的。”在評價“馬蜂窩從競爭對手處抄襲評論”一事時,業內人士給出了這樣的答案:這些評論並不屬於哪一個平臺,真正的所有者是使用者,然而使用者在這件事情上的話語權卻是0。
邦哥有一位朋友2004年去了雪鄉,那時雪鄉還默默無聞。一年後搜尋“雪鄉遊記”,至少有20個不同的網站出現了他的原創遊記文章。似乎比起抄襲,這次的事件叫做“搬運”還更為貼切:平臺不生產評論,平臺只是評論的搬運工。而馬蜂窩,顯然不是唯一一個搬運者。
有業內人士表示,其他平臺也多多少少有類似的情況,用技術手段抓取其他平臺數據內容,是業內相當常見的一種做法,只是用得多和用得少的問題而已。
而另一位從業者則表示,即便馬蜂窩的資料量並沒有他們自己標榜得那麼大,但馬蜂窩已經是行業內的頭部公司了,“其他平臺又能比它(馬蜂窩)的資料量大到哪去呢”?
複製貼上是很容易的工作,在業內很多人看來,網際網路就是這樣的:“這個時代,有幾家網際網路公司的資料是真的?”
我們誰也不知道答案。
價值導向,催生行業“原罪”
“我們的PGC又有用又優秀,奈何你們只要資料說話”——這是邦哥朋友圈的一條評論動態。
某種程度上講,這代表了相當一部分人的看法和無奈:在流量至上的時代,有時不被裹挾,太需要天時地利人和。
馬蜂窩由陳罡和呂剛創立於2006年,但卻是從2010年才正式開始公司化運營,那時公司的註冊使用者只有15萬。
而直到2012年6月,馬蜂窩才開始商業化嘗試,那之前的2011年,公司進行了500萬美元A輪融資,並拿到了200萬美元的無息貸款來支撐日常運營。
2013年4月,馬蜂窩獲得啟明創投領投的1500萬美元B輪融資,次年6月,馬蜂窩的註冊會員突破5000萬。
2015年2月,馬蜂窩獲得了高瓴資本、Coatue、CoBuilder、啟明創投的C輪融資,累計融資逾億美金。
在質疑馬蜂窩的文章中,有這樣一段話:
但事實上,這一萬五千人,恐怕還真的不一定是殭屍。
據幾位馬蜂窩重度使用者的表述,2015年到2016年,馬蜂窩點評部分的突然活躍,跟當時馬蜂窩的活動有關。那時馬蜂窩正需要“資料說話”,於是開始用刷回答和點評獲得“蜂蜜”的手段,激勵使用者刷點評,寫遊記和評論。
從2015年初到年中,馬蜂窩的線上活動日漸瘋狂,一度每週都有活動且“蜂蜜”完全不限量,50000蜂蜜就可以換一個索尼nex5的套機,實物獎勵同樣極其豐厚。據老使用者回憶,重獎之下,大量使用者開始自發地手動刷點評,“抄襲”、“搬運”之作,都相當常見:“沒去過的人只能通過去其他網站扒資料過來,而且就我知道的馬蜂窩對這個情況知情且預設的。”
截至發稿,邦哥仍未等到馬蜂窩的迴應,因此對於資料和新聞的相關真實性,我們不做更多的評論。2015年9月,馬蜂窩使用者數達1億,其中80%的使用者來自移動端(馬蜂窩自由行APP);月活使用者數達8000萬。從開始公司化運營的15萬用戶,到達成“1億使用者”成就,馬蜂窩用了五年時間。
然而,PGC和UGC內容的產生,顯然都需要更多的時間進行積累,恐怕很難與使用者數量的增長率保持完全的正比關係。有人說創業公司從第一天起就不要碰刷榜刷量,以及扒別人的資料據為己有。因為江湖這麼小,出來混遲早會還的。然而也有人懷著更加深重的無奈對邦哥說:去見投資人別人第一句就是你有多少使用者,我不刷量可能已經死了,你告訴我怎麼選擇?
資訊化時代,價值導向中對於資料的追逐,終於成為了很多網際網路企業一開始就揹負的“原罪”。
互聯網時代,到底還有什麼是真的?
我們無法得知馬蜂窩內部對ofollow,noindex">於點 評數是否有硬性的KPI,這些KPI又如何被制定,最終被推行和實現。我們也無法單純地指責一家企業以實物獎勵激勵使用者進行點評的做法,因為也許這也並非是公司的初衷。
但對於從業者無意間那句“網際網路企業有幾個資料是真的”,邦哥又無法真的放下:流量的紅利期正在過去,與之相矛盾的是,大資料時代的到來,讓整個網際網路行業對於資料的依賴日漸深重,無法回頭。
馬蜂窩不是唯一一個被質疑資料真實性的平臺,旅遊業也不是唯一一個被質疑資料真實性的行業。
2018年9月3日,一個半月之前,愛奇藝率先宣佈了一項或許對整個中國網路視訊行業豆漿影響深遠的決定:取消前臺播放量顯示。和收視率之於電視臺一樣,播放量,曾經是網路視訊平臺的“信仰”。然而信仰們卻日漸崩塌。
很多年裡,播放量就是網路視訊平臺的“收視率”。曾經“收視率高”、“播放量大”,毫無疑問地意味著“作品出色”:某種程度上講,電影、劇集、綜藝,這些視訊產品的質量,在資料未造假之前,是與“播放量”指標毫無疑問呈現正相關的。
但隨著大資料時代的到來,行業和投資方、廣告商越來越依賴這些資料來進行商業決策,其背後代表的巨大利益,使得資料本身的安全性和純淨性,受到了巨大的威脅。
於是我們看到,一些電影明明質量平平,票房卻動輒十幾億;一些電視劇並未給觀眾留下深刻印象,點選量卻超出全國人口總和;真正優質的作品被虛假資料反攻以至賠錢離場;製作敷衍的差評作品卻佔領渠道和流量,成為“賺錢典範”……
信仰的崩塌,是因為資料本身逐漸從“真實”走向了“虛假”。“大資料”的可靠性,正在成為網際網路時代的“通用焦慮”,許多人在馬蜂窩此次事件的相關評論裡寫下一句話:到底還有什麼是真的?
警鐘為誰而鳴
2012年,一個叫做王建鋒 的出品人,第一次把電視臺、造假賣家的利益鏈公之於眾。收視率造假成本達到了3000-7000元一集。但那時候大家還能活下去,好多公司覺得還承擔得了。於是事件的結局是王建鋒損失2億,不再從事影視製作。
2016年,王長田在一個論壇上說,我們看到的所有電視節目、電視劇,收視率90%以上都是假的。光線傳媒在那之前因不堪忍受購買收視率的鉅額費用,宣佈退出電視節目市場。王長田在後來接受採訪時曾說,“幸好光線傳媒還有電影業務可以支撐,不然當時我們可能就死掉了。”
要知道,光線傳媒可是一家上市公司。
眾所周知 ,流量是越來越昂貴的。資料造假的成本在過去十年間,同樣水漲船高。而一旦成本高到了一定程度,產業鏈的某一環不堪重負的時候,必然會倒閉整個資料評價體系,甚至是生產關係的重構。
近一年來,影視行業對於播放量和收視率等指標造假的指責甚囂塵上,並不是因為行業突然找回了“道德感”,本質上是因為商業利益在“虛假資料”裡的逐漸失衡,導致行業整體成本結構的畸形,最終將所有人推向了生死存亡的邊緣,倒逼了行業的變革。
於是我們看到,愛奇藝在2018年9月3日,宣佈取消前臺播放量顯示,代之以“熱度值”。優酷雖然表示在找到合理有效評估方式前不會“動播放量”,但言下之意,顯然也在尋找替代方案。10月20日,則有報道稱騰訊也在內部宣佈,未來將以“會員拉新”為新的主要KPI,淡化播放量的影響和權重。
影視產業鏈已經不堪重負之下,做出了不得不做出的變革。其他行業呢?
我們不知道馬蜂窩最終的迴應會是什麼。但我們至少知道,警鐘為誰而鳴。