Netta CEO—Anita:如何用區塊鏈保護使用者的數字權益?
Live time:2018.09.10 20:00
微信社群:極熱區塊鏈研究所(該對話群擁有眾多的專案方和資深區塊鏈從業人士)
對話嘉賓:Netta CEO Anita博士、石寧博士、極熱區歐鑫
嘉賓介紹
Anita博士,Netta,Fractals創始人及CEO。浙大博士期間的研究方向為如何將人工智慧技術運用在分散式可信自治領域。她聯合母校導師,浙江大學博導高濟教授創辦了黑雲高濟實驗室,在分散式自治領域的具有世界領先性。同時已成熟的搜尋引擎,彌補了谷歌百度演算法在資訊挖掘過程中的遺漏與偏差,大大提升了使用者友好性,已被國家多家大型機構用於輔助徵信調查使用。Anita本人擁有多項自主發明專利。江蘇省網際網路協會成員,青年企業家聯合協會成員。
石寧博士,D3Chain 創始人,石寧博士曾擔任IBM高階研究員、中山大學教授,是連續多年的Elsevier高被引學者。石寧擔任過某第三方支付公司CEO,2016年在國際期刊發表論文,提出緩解POW算力集中問題和自私挖礦問題的DPOW新型共識演算法。2018年創立D3鏈,致力於底層公鏈技術的研發和產業應用,目前和多家上市公司開展區塊鏈落地應用專案。
開場
極熱區歐鑫:大資料時代下,網際網路巨頭通過使用者瀏覽、搜尋、支付、應用等行為任意蒐集使用者資料似乎已經成為業內預設行為,我們已置身於一個完全個人資料“裸奔”的時代,大資料在給我們提供便利的同時,比如網購時會彈出我們想要的商品、瀏覽新聞時會推送我們感興趣的頭條、打開出行APP會提示目的地交通情況……也有越來越多的人認識到數字權益的隱私和安全的重要性。面對毫無祕密可言的大資料時代,我們該如何保護我們的數字權益?現在有請Netta CEO—Anita Xie給我們帶來的《如何用區塊鏈保護使用者的數字權益》對話分享。本次對話由D3Chain 創始人—石寧主持。石寧曾擔任IBM高階研究員、中山大學教授,是連續多年的高被引學者。石寧也是朝旭量化基金的創始人,並擔任過某第三方支付公司CEO,在金融科技領域創業成果豐碩。石寧2013年接觸比特幣,2016年在國際期刊發表POW底層協議研究論文,2018年創立D3Chain,致力於底層公鏈技術的研發和產業應用。歡迎大家關注並踴躍提問討論。
Antia:大家晚上好!
石寧:大家晚上好!今天很高興能夠在這裡和Anita就“區塊鏈如何保護使用者數字權益”進行探討。
問題一
石寧:今天我們的話題是“如何用區塊鏈技術來保護使用者的隱私安全”,能簡單說一下你的理解嗎?
Antia:首先,我們越來越明顯的意識到人們的生活日益依賴於數字世界的比例甚至超過了現實世界。比如我們通過見面認識的人遠不如在微信的朋友多,但是諷刺的是大家在現實世界所擁有的天經地義的權利在數字世界並不存在。比如我們在現實世界中不允許陌生人不經允許進到我們的房間,可是在數字世界裡我們的個人資訊不經過我們的同意就被收集轉賣。
我們平時在商場購物的時候購物車裡的東西是不允許別人隨意翻看的,但是在數字世界裡,我們剛買了機票,各種酒店的推銷資訊就隨之而來,我們隱私資料被隨意翻看,可見,我們所以為的“免費”資訊瀏覽其實只是表象,事實上我們為此付出了大量隱形的代價,我們的資料原本是屬於我們自己的,卻被中心機構肆意搶佔後牟利,無數的使用者權益並沒有使我們獲益,而是逐步堆積了中心化機構的龐大市值。
然而越來越多的人也逐步意識到了資料隱私的重要性,比如說歐盟最近出臺的隱私保護法律,規定在沒有徵得同意的情況下,收集私人資訊是違法的,包括姓名、DNA、證件號碼等。
但是這種監管方式真的有效嗎?其實對於個人來說沒有可操作性。在利益驅使下的行為,通過由上而下的監管可以監管過來嗎?比如現在定一個到北京的機票,過兩天北京酒店資訊就發給你了。你知道你的位置私人資訊被出賣的,這種情況你能怎麼辦?你能去聯絡歐盟告它嗎?你知道去哪裡告,告誰?歐盟會受理嗎?這種情況下怎麼舉證你的資訊是被哪家機構盜取呢?而且除了個人資訊,其他資訊也需要被保護,比如原創文章被抄襲。這種情況怎麼辦?
所以這種由上往下、事後懲罰的機制,沒有辦法真正保證數字權益的隱私和安全性。我們必須有一種不同的機制。不是從上而下,而是從下而上,每個人有保護自己的能力,而不是靠權威機構。不是靠事後懲罰,而是事先有辦法防止。
石寧:目前來看,現存的機制沒能真正保護使用者,所以我們需要一個新的機制。區塊鏈技術會不會就是這個辦法呢?
Antia:我覺得區塊鏈技術是一個方向和出路。
問題二
石寧:對於剛剛提到資訊侵權問題,市面上也有各種“區塊鏈+”版權的產品。
對於“區塊鏈+”版權或者說確權,如果想取得成功,您覺得重點需要考慮哪些方面?
Antia:首先這裡我想先提出一個觀點,我並不認為我們需要做的是“區塊鏈+”,而應該是“+區塊鏈”,區塊鏈作為一種防篡改,可溯源的技術,一定是更好的為生活服務的。而不是為了技術而技術,為了區塊鏈而區塊鏈,一股腦的為了套用技術而去硬套出一些我們其實並不需要的應用,因此我們要在真正存在的需求中通過使用區塊鏈技術而提供更好的使用者體驗和價值。那麼對於“+區塊鏈”的版權成功,我認為也一定是一套完整的解決方案。什麼叫完整的解決方案呢?一定是從資料的產生,到儲存機制,到使用過程,利益分配等各個環節,都有系統的考慮和對策。但不是單單隻考慮其中一個點,那樣必定是斷層的,真空的,難以融合到實際落地場景中的。
那麼我這裡提出三個問題,大家和我一起思考:
1.我毫不知情,隱私資料被大公司任意侵佔甚至賣給廣告商,接踵而來的騷擾資訊,誰能保護我的隱私?
2.資料剛產生就被抄襲(文件、程式碼、流媒體),誰才真正的原創?如何保護原創的權益?
3.搜尋引擎的廣告模式十幾年沒有變過了,何時才能安安靜靜的搜個好醫院而不是鋪天蓋地的廣告?他們收穫鉅額的廣告收益,可一次次被廣告的是我,我為什麼分不到收益?
為什麼我提出上述三個問題,因為我認為這三個問題,是我們在數字權益中最常遇到的困擾,並且我們可以發現,這三個問題是環環相扣的,任意一個環節沒有得到有效解決,必定會因為另外兩個問題而受到制約和影響,因此若要想要真正做到隱私和權益保護,我們需要從這幾個方面去系統的給出一個解決方案。
問題三
石寧:資訊被濫用,被侵權,收益分配。確實需要我們大家找到一種方法或者機制來解決這些問題。那麼,一個完整的使用者資料隱私與權益保護的機制,您認為應該具備哪些特點呢?
Antia:針對上面的問題,我們認為一個完整的資料隱私與權益保護機制,它包括三個環節,第一資料儲存的源頭隱私保護,第二使用的過程的權益保護,第三如何去獲取到真實公正的資訊,那麼在這裡我總結為三個部分:去中心化儲存,去中心化確權,去中心化搜尋引擎。並且這三個部分,一定是在邏輯和技術設計上就原生相互呼應與支援的,就好比你單獨提出任意一部分,你發現在該環節仍然無法解決的問題,會在另外兩個環節中給出補足。
我舉個例子:
1、我們只提出去中心化儲存,確實打破了中心化儲存的資料侵佔問題,但即使這樣,我通過某次交易後,獲取了A在去中心化儲存的資料,然後我將其記錄下來,編輯成文,然後去網際網路其他地方再次出售,這時要如何保護A的原創權益呢?是否一次出售,就會被大量濫用了呢?去哪裡維權呢?
2、再或者我們做好了去中心化儲存和去中心化的確權,可是當我需要去查詢所需資料進行瀏覽或交易時,我如何才能找到真實可靠的資訊呢?而不是看到一大堆無用的或者低階的廣告內容?如何才能找到一個資訊的入口,幫助我甄別?若這一點做不好,我們前面的去中心化儲存和確權,將無法真正發揮其價值。
我們試圖通過一個技術點,去解決所有的問題,這是不實際的。我們真正需要的,並且可以落地的,一定是一個完整的產品,而不是一個片面的技術,因此我們需要從完整的產品線角度去思考和解決問題。真正從使用者的角度去發現需求,並系統的去解決。
石寧:Anita總的回答非常專業,一個完整的使用者資料隱私源於權益保護的機制,首先,要從資訊被濫用、被侵權、收益分配的業務/需求出發。其次,要系統化地解決,從資料儲存、確權、搜尋引擎三方面綜合地解決問題,部分地解決問題都是不足夠的。
問題四
石寧:要綜合地解決這個問題,技術上必須把這幾個方面結合到一起,形成一個完整的產品。而我們從Netta的官網上注意到,Netta專案已經做了許多工作,大家也很好奇Netta是一個去中心化可對資訊確權的作業系統,Anita可以給大家介紹一下嗎?
Antia:Netta就是從以上的思考出發,去系統的拿出一個整體的解決方案。Netta包含三個部分:去中心化儲存,去中心化確權,以及去中心化搜尋引擎。
1、NETTA提供不同於IPFS儲存效能的去冗餘去中心化儲存。
2、更進一步通過語義處理,資料流圖賬本和高併發共識機制,快速共識資訊在全網中的原創比例,做到“所有權、版權、使用權、分發權”的去中心化確權,並按照原創比例建立利益分配體系。
3、同時通過原生去中心化搜尋引擎,重構現有的中心化廣告模式,提供更加公平公正的呈現結果,並實現平行精準營銷,使得任意節點都可以在廣告過程中受益。
問題五
石寧:對於儲存我們知道IPFS是知名的去中心化專案,NETTA的去中心化儲存和IPFS主要有那些異同呢?
Antia:對於去中心化儲存來說,我想最關鍵的問題是兩個,一個是資料的加密問題,第二個就是儲存價效比問題。
石寧:對於資料加密,對大量資料進行加密,這是一個成本較高的操作,Netta專案是要求在使用者端加密,還是在礦工端加密呢?
Antia:在使用者端加密,我們是對密文進行儲存。那麼第一點,對於加密問題,我們一方面為了保護隱私,希望內容以密文的形式被儲存,另外一方面,又需要能在密文的基礎上對資料進行處理,這是一個矛盾點。現在的一種熱議的思路:同態加密,則也是為了解決這個矛盾點,但是不幸的是,同態加密技術在現階段並不成熟,無法真正的在工程上使用。
第二點,儲存價效比問題,價效比是指效能/代價的比率,同樣的空間,一種方法可以存1G的內容,而另一種方法,只能存500兆,則前者的價效比是後者的兩倍。
我來舉個例子:A和B了兩段資源,其內容只相差一個空格符,其他全部都一樣,在IPFS中,對整段內容hash,我們知道,即使存在一個字元的差異,hash的值也是完全不同的,因而整段內容會被重複儲存。所以有沒有辦法讓我們只須去多存那個空格,而不是大量儲存重複冗餘的內容,浪費儲存空間呢?而在Netta中,我們首先保證在密文基礎上,其次我們通過語義片段方法,可識別出只存在一個空格的差異,我們將只需要多存一個空格,而不會重複儲存一樣的內容。
石寧:加密之後,資料就分成了兩部分:原始資料和密文,分別儲存在什麼地方呢?
Antia:原始資料還是儲存在使用者端,密文是在礦工端。
問題六
石寧:原始資料儲存在使用者端,在什麼情況下會用到原始資料,而且如果使用者端下線之後,原始資料從哪裡獲取呢?
Antia:我們是從備份處獲取,並且通過我們的搜尋索引進行備份查詢。這就是我說的,單單一個部分一定是不能解決所有問題的,需要和其他部分一起相輔相成的去提出系統方案。
問題七
石寧:對於中心化確權,我們知道現在利用區塊鏈做確權溯源的專案非常多,那麼Netta的確權機制,和他們有什麼不同嗎?
Antia:關於確權問題,我想分享的是,現在大部分的區塊鏈確權專案,是基於轉賬邏輯在做確權,什麼意思呢,A的原創內容,我直接引用轉發,是會被區塊鏈確權所記錄到這個轉發動作的,但是我們換個思路,大部分抄襲者是不會傻傻的直接引用轉發的,通常是會抄下來,然後稍加修改,重新發布,那麼這個時候,區塊鏈這種基於轉賬邏輯的確權可能就沒有用武之地了。
那麼Netta的做法,是通過語義處理,將內容與全網資源進行比對,計算出原創比例,並且識別所抄襲的源頭和比例,並將這些資訊記錄在賬本中,在後期利益分配時可基於賬本做到收益與原創之間的公平分配。例如B引用了A百分之50,那麼B若獲得10個btc收益,則自動給A分享5個btc,將抄襲進行轉化為良性的共贏傳播行為。
那麼這裡就順便提一下我們的賬本,這麼多的原創與引用關係比例的記錄,在現有的blockchain的資料結構與有限語義表達能力下,是無法記錄,更無法自動分配利益的。
Netta的賬本有以下幾個特點:
1.賬本為資料流圖計算框架DFGF(Dataflow Graf Framework),其中包含:資料流圖以及圖計算引擎。突破DAG的無序性以及單純圖記錄模式,做到有序性的圖計算模式。
2.資料流圖以交易賬戶為節點,且智慧合約在賬本中表示為可觸發資料流,可觸發資料流被觸發執行,則對應於智慧合約被執行。
3.該資料流圖賬本基於全非同步PGB共識機制,共識過程具有高併發、天然抗雙花。
問題八
石寧:對於去中心化搜尋引擎,我們知道PageRank演算法是依據各個網頁的超連結進行權重排序,NettaRank跟PageRank相比,能給大家介紹一下兩者的異同嗎?
Antia:PageRank確實是基於超連結進行排序,那麼就會存在一個問題,大家都有親身體驗,就是當我們在輸入一個關鍵詞的時候,查找出來的推薦列表中,我們點選進去,發現正文並沒有我們想要的內容,而是在邊邊角角上的一條廣告連結上,出現了這個關鍵詞。
這就是PageRank中,大量的網頁為了增多點選和引用量,而在自己的主題之外貼上非常多的無關的廣告連結。
再比如,我是原創作者,我的內容在被搜尋時,跑到了第十頁,那麼一般人往往只會瀏覽前三頁的推薦,因此我這個原創並不被關注。然而某個抄襲者,卻跑到了第一頁去了,對於我的權益來說,是非常不公平的。
所以我們基於前面的去中心化確權,我們可以計算出每一條內容的真實價值以及原創值,並將抄襲和引用他的其他內容所獲得的收益,按照引用比例歸還於原創者,從而統計原創的真實價值,並按照此建立了NettaRank。
石寧:就是說PageRank演算法還是有缺陷,傾向於吸引流量。NettaRank則更傾向於保護原創者的利益。
Antia:對,NettaRank是結合前面的去中心化儲存與確權,做了一套保護使用者權益的搜尋引擎。
問題九
石寧:Netta專案從儲存,確權,搜尋系統化地給出瞭解決方案。都是這些都是屬於區塊鏈的範疇,然後區塊鏈一致被詬病TPS太低。比如Bitcoin和以太坊的TPS都非常低,Netta做到10萬TPS,遠遠高於Bitcoin和以太坊,這個能給大家介紹一下技術原理嗎?
Anita:前面我大概提了一下我們的底層賬本機制。我們的底層賬本為高併發資料流圖。那麼很多人會聯想到DAG,因為DAG也是圖,那麼我先簡單說一個Netta賬本和DAG的不同。DAG嚴格的來說,資料所記錄的拓撲結構是圖,是一種圖的記錄模式,而Netta做的是一種圖的計算模式,賬本本身是一個實時在計算的函式,也就是一個計算器,這個是從來沒有人做過的。
那麼DAG本身就是意識到了blockchain的單程序對速度限制,因而想通過圖結構來提高併發性。但是DAG所做的併發是一種無序的,常常會遇到有些交易長時間不被確認。從而也因此易產生雙花問題,我們知道計算的高併發,通常是需要基於一定的偏序關係的,那麼Netta則是在資料流圖上原生的綁定了一種偏序關係,也就是我們資料流圖上的共識機制。這種共識機制,必須原生和資料流的結構相呼應,因此我們的共識機制也是高併發的,簡單的來說,若此時全網有一萬筆交易在同時進行,即有一萬組礦工組對這一萬筆交易進行一對一的驗證。這就是我們的共識演算法,叫做基於交易歷史的隨機選擇BFT演算法,也就是我們的全非同步PGB共識機制,具體PGB大家可以去我們的官網瞭解。
問題十
石寧:我們還注意到Netta專案也有智慧合約,而且是圖靈完備的智慧合約。那麼圖靈完備使合約具有了豐富功能,但是以太坊為規避停機問題而採用了GAS機制,Netta智慧合約是如何處理停機問題的呢?
Anita:對,這個是我博士期間的研究方向,我的方向是人工智慧如何運用在分散式可信領域,不過我學的是傳統人工智慧,不同於現在的機器學習,更側重的就是語義和資料流圖推理機制。
這裡有需要引入一個新的觀念,在我們Netta當中,我們摒棄了智慧合約,我們有一種自己原創的可執行程式碼,我們稱之為 "社會承諾“。社會承諾是圖靈完備的,並且能夠表達一階謂詞邏輯,可以表達比智慧合約更為豐富的知識和語義。
對於您說的這個智慧合約的停機問題,我認為這本身是智慧合約設計上的一個缺陷。即使用了gas機制,仍然存在安全漏洞,比如說,若利益足夠大,黑客可通過足夠的gas使之持續執行。
而在我們的社會承諾機制中,由於其本身就含有更豐富的知識和語義表達能力,它的執行條件包括precondition,postcondition,deadline,excute pattern等。
而這裡的excute pattern執行模式,則是對應於gas所做的事情,而我們的機制中,使用者本身可對其社會承諾設定可被執行多少次,或者可執行的條件。
群友:FLP不可能原理:在非同步通訊場景中,沒有任何演算法能保證達到一致性,貴鏈10萬TPS,還能說得詳細一點嗎?貴鏈是用什麼語言開發的?
Anita:FLP不可能原理裡面不能達到一致性的原因在於網路分割槽攻擊,這個和10萬TPS是兩個不同的問題,沒有直接的相關性。而10萬TPS是通過我們的高併發共識機制和資料流圖結構來實現的,前面講過了。
石寧:謝謝Anita總,Netta專案從需求出發,然後分別在儲存、確權和搜尋等方面都做出了巨大創新,綜合地給出了技術方案。特別地基於圖計算模式,將TPS提高到10萬,還摒棄了智慧合約的概念,而提出了社會承諾,Netta專案是個有特色的專案,針對業務需求的專案。
Anita:謝謝石總的交流和主持,理解非常到位,可見紮實的基本功。
石寧:不知不覺已經過去了2個小時,我想朋友們也收穫了不少乾貨。但是我想大家還有許多技術問題,以後再找機會當面與Anita總溝通交流。謝謝Anita總,謝謝大家!
Anita:若大家還有問題,可以提問交流。也歡迎私下溝通。謝謝大家!
極熱區歐鑫:謝謝兩位老總!辛苦了!今晚的對話分享先到此結束!謝謝大家關注!晚安!
來源:100BLOCK
本文由布洛克專欄作者釋出,代表作者觀點,版權歸作者所有,不代表布洛克科技觀點
——TheEnd——
關注“布洛克科技”