知識圖譜賦能金融科技,看這一篇就夠了
資料是數字經濟時代的新型生產資料。
基於資料的生產變革和業務模式創新正驅動著全球範圍內經濟社會各個領域的數字化、智慧化轉型。金融行業因與資料的高度相關性,成為人工智慧最先應用的行業之一,而知識圖譜作為人工智慧技術的重要研究方向與組成部分,正在快速滲透到金融業務應用層面,並日益成為金融科技的“底層支撐”。
“金融知識圖譜”是金融行業語義理解和知識搜尋的基礎技術,可以為風險評估、預測、反欺詐、精準營銷、智慧搜尋等提供技術支撐。 越來越多的金融機構及企業在探索構建金融領域的知識圖譜研究,將海量非結構化資訊自動化利用起來,為金融領域應用決策提供更精準、更可靠的依據。
什麼是知識圖譜?
知識圖譜本質上是一種大規模語義網路,是一種基於圖的資料結構,由節點和邊組成。在知識圖譜裡,每個節點表示現實世界中存在的“實體”,每條邊為實體與實體之間的“關係”。通俗地講, 知識圖譜就是把所有不同種類的資訊連線在一起而得到的一個關係網路。知識圖譜提供了從“關係”的角度去分析問題的能力,是關係表示最有效的方式之一。
相對於傳統的描述方式,知識圖譜有三大特點:
(1)多維度,需要從大量的資訊源中抽取多維度的特徵資訊,為後續演算法拓展深度關聯關係提供必要的素材。
(2)深加工,在資訊素材的基礎上,通過智慧推理實現從資料到智慧的深加工。
(3)視覺化,深加工的結果以視覺化的方式展現給使用者,並與使用者互動,直觀易懂。
知識圖譜技術溯源
知識圖譜的發展歷程可以追溯到20世紀70年代誕生的專家系統,專家系統一般由知識庫與推理引擎兩部分組成,它積累了大量的某個領域專家水平的知識與經驗,根據知識和經驗,模擬人類專家的決策。1984年由Douglas Lenat設立的Cyc是這一期間較為出色的本體知識庫。
1989年全球資訊網的出現,為知識的獲取提供了極大的方便,1998年,全球資訊網之父蒂姆·伯納斯·李再次提出語義網,語義網直接向機器提供可直接用於程式處理的知識表示,它也是NLP(自然語言處理)的前身。
2001年維基百科誕生使得全球使用者可以通過協作完成數上百萬詞條的知識,推動了很多基於維基百科的結構化知識的知識庫的構建,DBpedia、Yago等屬於這一類知識庫代表專案。
2006年,伯納斯·李提出連結資料(Linked Data)的概念,希望資料不僅僅釋出於語義網中,而要建立起資料之間的連結從而形成一張巨大的連結資料網。隨後,2007年DBpedia專案開始執行,它是目前已知的第一個大規模開放域連結資料。
2012年5月16日,Google釋出了名為“知識圖譜(Knowledge Graph)”的“智慧”搜尋功能,在Google傳統搜尋列表右側,添加了與搜尋關鍵詞相關的人物、地點和事物相關的事實,相比傳統搜尋結果頁,這種搜尋模式提供與詞彙所描述的“實體”或概念匹配的頁面,這也標誌性著知識圖譜正式誕生。
知識圖譜的構建與分類
知識圖譜的歷史使命是作為一個巨大的背景知識庫讓機器具備語言認知能力。有了知識圖譜,機器看到的不再僅僅是字串,而是可以把這些字串對映到各種各樣的實體、概念,從而建立機器自己的認知世界。建立一個完整精細化的知識圖譜所依賴的背景知識庫必須滿足三個條件:
第一個是知識庫有規模要足夠大,必須涵蓋足夠多的實體和概念。
第二個是知識庫語義關係要足夠豐富,描述現實世界的語義關係是豐富多樣的,知識庫要涵蓋常見的語義關係。
第三個就是知識庫表示結構要十分友好。文字是一個巨大的載體,但是文字是一個非結構化資料表現形式,機器很難處理,而知識圖譜往往表達為RDF結構,是一種結構友好的表達形式,是能夠被計算機有效處理的。
從技術的角度來看,知識圖譜構建流程包含 資訊抽取、知識表示、知識融合、知識推理 四個階段。從最原始的結構化、半結構化、非結構化資料出發,採用一系列自動或者半自動的技術手段,從原始資料庫和第三方資料庫中提取知識事實,並將其存入知識庫的資料層和模式層。
根據覆蓋範圍而言,知識圖譜也可分為 開放域通用知識圖譜 和 垂直行業知識圖譜 。 開放通用知識圖譜注重廣度,強調融合更多的實體,主要應用於知識獲取的場景,要求知識全面, 如搜尋引擎,知識問答;比較著名的知識圖譜庫有Freebase、Wikidata、Yago、DBPedia、Wolfram Alpha等。
行業知識圖譜通常需要依靠特定行業如金融、電信、教育等行業的資料來構建,主要應用於行業智慧商業和智慧服務的場景,要求精準,如投資決策、智慧客服等。行業知識圖譜中,實體的屬性與資料模式往往比較豐富,規模化擴充套件要求更迅速、知識結構更加複雜、知識質量要求更高、知識的應用形式也更加廣泛。
知識圖譜的玩家有哪些?
凡是有關係的地方都可以用到知識圖譜,目前知識圖譜在多個不同的領域得到了廣泛應用,知識圖譜產品的客戶行業分類主要集中在:社交網路、人力資源與招聘、金融、保險、零售、廣告、物流、通訊、IT、製造業、傳媒、醫療、電子商務和物流等領域。
主要的玩家大致可以分為兩類,一類是網際網路巨頭,如阿里商品知識圖譜、騰訊雲“星圖”、百度“知心”、搜狗“知立方“等;另一類是創業公司,如脈脈、天眼查、企查查、中誠信徵信、知因智慧、文因互聯、明略資料、達觀資料、智言科技、海知智慧、淵亭科技、海智星圖、海致大資料等企業。
創業公司又可以細分為兩類:一是專注於單一的金融領域,如知因智慧、文因互聯、智言科技;另一類則是選擇社交、企服、金融、法律、公安、航空、醫療等多個垂直領域同時推進,如明略資料主打公安、金融、工業;擅長長文字分析的達觀資料則主攻金融、製造業、法律;海知智慧主攻智慧家居、醫療、金融;淵亭科技則在航空、醫療、軍工、通訊、教育等多個領域均有涉足。
金融知識圖譜可以做什麼?
1、風險評估與反欺詐
如今數字金融欺詐形式不斷更新、紛繁複雜,欺詐手段逐漸表現出專業化、產業化、隱蔽化、場景化的特徵。
傳統反欺詐技術的維度單一、效率低下、範圍受限的劣勢越來越明顯。在反欺詐場景中,知識圖譜可以聚合與借款人相關的各類資料來源,包括借款人的基本資訊、日常生活中的消費記錄、行為記錄、關係資訊、網上瀏覽記錄等,然後抽取該借款人的特徵標籤,從而將相關的資訊整合成進結構化的知識圖譜中,在此基礎上,對該借款人的風險進行全方位的分析和評估。
除了申請階段的反欺詐,通過構建已知欺詐要素如手機、裝置、賬號、地域等的關係圖譜,全方位瞭解客戶海量風險資料的離線統計分析,按主題要素收集風險運營的結果反饋,建立客戶風險特徵資訊庫,優化風險模型和規則,還能做到交易階段的反欺詐。
2、風險預測
風險預測包括對潛在風險行業預測和潛在風險客戶預測。
在潛在風險行業預測上,基於多維度資料對行業進行細分,根據行業資訊建立關係挖掘模型,展示每個行業之間的關聯度,如果某一行業發生了行業風險或高風險事件,可以及時預測未來有潛在風險的關聯行業,金融機構從而可對相關行業的風險做出預判,儘早地發現並規避風險。
在潛在風險客戶預測上,通過知識圖譜整合和關聯企業內部結構化資料、非結構化資料以及網際網路採集資料、第三方合作資料,發現和建立企業與企業之間的集團關係、投資關係、上下游關係、擔保關係,企業與個人之間的任職、實際控制、一致行動關係,及時預測未來有潛在風險的關聯企業。
3、精準營銷
針對個人客戶,知識圖譜可以通過連結的多個數據源,形成對使用者或使用者群體的完整知識體系描述,挖掘已有客戶的潛在需求,針對性地推送相關產品,為客戶提供營銷服務。
例如,金融公司的市場經理用知識圖譜去分析待銷售使用者群體之間的關係,去發現他們的共同愛好,從而更有針對性地對這類使用者人群制定營銷策略。如果對知識圖譜擴充套件(如個人愛好、電商交易資料、社交資料等),還可以更加精準地分析客戶行為,進行精準推送。
針對企業級客戶,通過分析包括企業基礎資料、投資關係、任職關係、專利資料、招投標資料、招聘資料、訴訟資料、失信資料、新聞諮詢等企業資料勾畫出企業客戶的資金關係、法人關係、上下游投資關係、相似企業業務關係等構建起企業知識圖譜,為企業推薦合適產品、服務。
4、智慧搜尋和資料視覺化
智慧搜尋的功能指的是,知識圖譜能夠在語義上擴充套件使用者的搜尋關鍵詞,從而返回更豐富、更全面的資訊。
比如,搜尋某個人的身份證號,可以返 回與這個人相關的所有歷史借款記錄、聯絡人關係和其他相關的標籤(如黑名單等)。這些結果可以用圖形網路的方式展示,從而把複雜的資訊以直觀明瞭的影象呈現出來,讓使用者對隱藏資訊的來龍去脈一目瞭然。
結語
網際網路促成了大資料的集聚,大資料促進了人工智慧演算法的進步。
新資料和新演算法為規模化知識圖譜構建提供了新的技術基礎和發展條件,使得知識圖譜構建的來源、方法和技術手段都發生極大的變化。知識圖譜作為知識的一種形式,已經在語義搜尋、智慧問答、資料分析、自然語言理解、視覺理解、物聯網裝置互聯等多個方面發揮出越來越大的價值。
尤其在金融領域,從資料視覺化、風險評估與反欺詐、風險預測到使用者洞察,知識圖譜的底層性支撐作用越來越顯著。
AI浪潮愈演愈烈,知識圖譜賽道也從鮮有問津到緩慢升溫,隨著更多入局者的出現,未來這條賽道將會越來越擁擠。
在產業不斷創新發展、智慧融合、技術推動的新形勢下,資料、場景、流量是金融科技未來發展的基石,在這一基礎上延伸出的智慧解決方案、智慧風控、反欺詐、智慧營銷、智慧催收、智慧投顧等業務百花齊放。雖然過程坎坷起伏,但終點明確又清晰。未來,金融科技將成為金融產業下一階段競爭的核心生產力。
2018年11月30日,北京國貿大酒店,2018億歐創新者年會【金融科技創新者論壇】火熱報名中:搶票連結
ofollow,noindex">https://www.iyiou.com/post/ad/id/708
版權宣告
凡來源為億歐網的內容,其版權均屬北京億歐網盟科技有限公司所有。文章內容系作者個人觀點,不代表億歐對觀點贊同或支援。