“標記”何以能“標拒”騷擾詐騙電話
“標記”何以能“標拒”騷擾詐騙電話 |
稿件來源:新華每日電訊 調查觀察 |
本報記者完顏文豪、顏之巨集
靠近北京西北四環的一棟寫字樓裡,韓景維掏出手機撥出一個號碼。很快,他的號碼顯示在對方的來電提醒裡。這樣一個司空見慣的場景,其實在短短數秒鐘內,就已經經過一系列複雜的查詢、識別和過濾。如果打來的是一個騷擾或詐騙電話,智慧手機上便會出現相應的標記,看似簡單的小事,背後卻需要一個龐大的資料庫和一套完善的模型來支撐。
打算購房的人剛看完一個樓盤,便收到密集的房屋推銷電話;簽完購房合同沒幾天,各類詢問貸款需求的電話頻頻打擾;接到大學錄取通知書後,一個個假冒提供助學措施的詐騙電話緊隨而至……生活在騷擾和詐騙電話不斷來襲的當下,我們靠什麼來守住一片寧靜的空間?
大資料與科技運算已經提供瞭解決方案。多年來,騰訊手機管家安全專家韓景維和團隊成員一直致力於此。如今,這個團隊建立的資料庫,已經儲存了1300多萬個被標識為騷擾或詐騙等有問題的電話號碼。
“每呼叫一次,便在資料庫裡經過一次查詢,每天的查詢量在15億次,其中能查到的騷擾或詐騙電話在4000萬次左右。”韓景維介紹說。
據介紹,完成上述任務的核心是一個儲存有龐大問題號碼的資料庫。一部分資料來源於手機使用者的主動標記行為,頻繁被標記的問題號碼就會上報到資料庫裡。
另一個重要的資料來源,則是通過騰訊手機管家團隊建立的模型運算出的結果。騰訊手機管家首先把一套安全系統部署到手機運營商,然後對運營商提供的海量撥號資訊資料進行格式化、標準化,通過模型的運算精準識別出哪些是有問題的號碼。
韓景維舉了這樣一個例子,公安部門在破獲一起電信詐騙案後,把查出的一批詐騙電話號碼提供出來,比如有50個詐騙號碼,騰訊的安全系統會對這50個號碼進行多維度的資料運算,機器學習模型會對GPS座標、通話記錄、通話頻次等號碼資訊展開歸納學習,摸索出這些詐騙號碼的規律後,再挖掘出尚未被查獲的其他詐騙號碼。
無論是使用者主動上報的問題號碼,還是經過系統運算識別出的詐騙號碼,都會被儲存在一個數據庫裡,在人們接到陌生號碼的那一刻,立即做出相應的標記提醒。
在為人們守護寧靜的同時,使用者通話資訊的隱私如何得到有效的保護?據介紹,網際網路公司把手機安全系統部署到手機運營商,是為了識別、收集騷擾或詐騙等問題號碼,因此取回的資料不涉及正常的使用者號碼,在模型運算中也不會涉及使用者的通話內容等隱私資訊。