2019年金融大資料應用的趨勢、機遇和挑戰
從精準營銷、智慧客服、差異化定價到智慧風控、智慧理賠、智慧催收,金融大資料、雲端計算、人工智慧和區塊鏈技術正在從資料層、智慧層、產品層多維度地向金融領域的細分場景和業務鏈條各環節滲透,金融機構的執行效率大大提高,金融服務日益呈現出場景化、平臺化、智慧化的發展趨勢。
金融行業面臨全新的挑戰和機遇,如何把握金融科技發展趨勢,將新科技和金融業務有機融合,提升綜合實力和科技創新能力,成為目前金融機構面臨的重要課題。
11月30日, ofollow,noindex">億歐金融主辦的“2018億歐創新者年會——金融科技創新者論壇 ”,邀請到了銀行、消費金融公司、供應鏈金融服務公司、產業資本、智慧風控、金融大資料等創新型金融科技公司共同探討監管科技、開放銀行、場景金融、大資料風控、知識圖譜等行業熱點話題。
受邀參加此次峰會的嘉賓有:民生銀行資訊科技部總架構師李曉東,盛景嘉成產業網際網路基金主管合夥人趙今巍,輝騰科技金融執行總裁葉陽,馬上消費金融CTO蔣寧,領渢資本創始合夥人馬寧,維金創始人兼CEO俞強華,百融金服副總裁王正明 ,中譯語通科技股份有限公司CEO於洋,氪信合夥人、副總裁高強,華創資本副總裁餘振波,億歐公司副總裁兼智庫研究院院長由天宇,億歐公司合夥人兼金融頻道主編劉歡,億歐智庫助理研究經理薄純敏。
本次金融科技圓桌論壇環節主題為:2019年金融大資料應用的趨勢、機遇和挑戰。
參與本次圓桌論壇的嘉賓有:中譯語通科技股份有限公司CEO於洋;氪信合夥人、副總裁高強;華創資本副總裁餘振波出席並參與討論。億歐合夥人、金融頻道主編劉歡擔任此次圓桌論壇主持人。
以下是圓桌論壇環節對話速記:
億歐合夥人、金融頻道主編劉歡
劉歡(主持人):接下來的時間將由我為大家主持圓桌論壇環節。參與討論前,我們先回顧下今天主題的背景,下午9位演講嘉賓從巨集觀背景,從投資環境,也有從具體業務層面等多個維度跟我們談了金融科技在產業的具體應用。如果追根究底來看的話,我們會發現所有的基礎,最終都落實在金融大資料之上。金融大資料是整個金融產業的基礎設施,形象來講金融大資料就好比是構建整個“金融產業大廈”的“磚瓦”。
從過往經驗判斷,大多數人會覺得金融資料是以金融系統內資料為主。而金融系統的資料完整性、權威性甚至包括準確性都做的非常好。但是在另外一個維度,隨著場景的逐漸多元化,非金融資料對於金融產業的影響越來越大。
劉歡(主持人):討論問題前,首先請各位嘉賓跟觀眾打個招呼並一句話簡單介紹一下自己目前所做的具體的工作。
中譯語通科技股份有限公司CEO於洋
於洋:大家下午好,我是中譯語通的於洋。中譯語通2013年開始運營,主要專注的方向在大資料、人工智慧和語言科技。金融完全是一個新拓的領域,但是在新的領域裡面,我們有自己獨到的理解。
高強:大家下午好,我是氪信科技高強。氪信是一家2015年創立的金融科技公司,我們始終定位在通過AI和大資料的技術幫助金融機構在大資料的時代去更好地通過資料驅動的方法,去服務好各種各樣的客戶。氪信希望通過AI的技術,能夠更好地深挖資料,讓銀行這一類的機構更好地用好資料,更好的敏捷地服務客戶,我們提供了一整套的服務方案,近期我們還發布了最新的AI決策引擎“非或然”。謝謝大家!
餘振波:大家下午好!華創資本是一家專注於早期高成長企業投資的VC,金融科技是我們非常重要的一個方向,我們在金融科技總共投了30多家企業,這其中包括一些在市場上比較知名的企業。
劉歡(主持人):感謝三位嘉賓的介紹。
2018年,我們能夠明顯的看到,金融產業的變化更加開放,金融產業從壟斷市場開始逐漸破冰,未來肯定會以更市場化的運作方式為主導。金融開放一定會成為金融產業主旋律。過往金融大資料大家提了很多,但就經驗來看, 金融大資料的外沿會更加廣泛,它包括了金融資料和非金融資料,有請三位嘉賓談談自己對於非金融資料的一些理解和具體的思考。
於洋: 講到非金融資料,在很多年以前大家更願意把它翻譯成可替代資料(Alternative Data)。Alternative Data在金融產業裡面也有叫另類資料/場景資料等等,但現在更多比較規範,將其定義為“另類資料”。
另類資料相對於我們使用的基本面資料,比如稅務資訊,比如從太空當中大家拍攝到的停車位的一些圖象資料,可能在傳統資料裡面,以上沒有被利用到金融領域裡面去。
某種意義上來看,我們一般講大資料的話叫結構化資料、科學化資料,而採集到的另類資料恰恰就是90%的非結構化資料。在所有的大資料裡,10%是結構化資料,比如銀行的結構化資料。結構化資料從體量上來講相對小一些。 非結構化資料是不規則的,比如影象、語音等等這些形式。
但是在今天這些另類資料可以爆發出相當大的能力,比如我們在第一次預測當中,8月份上海股指漲跌做了第一期演算法,20天的預測裡面,基本上我們的預測都是準確的。上海綜合股指每一天漲跌的具體的數字,誤差可以控制在1%以內。我們所用的演算法,除了基本面的資料,更更要的是情緒化資料的納入。市場情緒是非常重要的,而這些在我們之前從來沒有被納入到量化、對衝裡面去,它可以爆發非常大的力量。
比如說中國從伊朗購買原油,用人民幣結算。但是對於原油價格的預測裡面,我們只是用供求兩端的資料去做一些預測。但是這個交易本身,APEC會議後市場反應是什麼樣的?中國的市場的反應是什麼樣?美國、俄羅斯的反應又是什麼樣的?而這些資料以前是阿拉伯文、英文的等等,對於我們來說,首先語言就是一個門檻。語言對於計算來說是0和1之間的關係,對於自然語言處理也是一樣的,不會轉換,一切都是0。
在市場上,機構的反應、民眾的分析、社交的輿論這些主體的反饋並不盡相同。同樣大家的情感呈現,有正面的、極正面的、負面的、極負面的,這些可能對市場產生不一樣的影響。
這些另類資料可以應用到金融層面,無論是系統性的風險,還是大的趨勢風險判斷,都可以納入另類資料。另一方面,另類資料對於股指、期貨、大宗商品交易等等這些指數的預測,也會帶來巨大的影響。另類資料在美國討論也不過兩年的時間,相信從理論到深度應用還有很多路需要探索。這就是我對另類資料的一些理解。謝謝。
氪信合夥人、副總裁高強
高強:我想和大家分享一下我們在實踐當中的一些感受。氪信一直強調對資料的整合挖掘效果。氪信一直說是AI+大資料,為什麼這麼說呢?我們放到再遠一點講,每一次技術的革新,它的作用到底是什麼?AI的這一次技術革命它的作用是什麼?那麼我們想一個新的技術,它實際上是在拓展我們人類對我們已有的這些資源的開發的能力。那麼這一次我們講AI和大資料,我們覺得AI這個工具它實際也是在拓展我們對我們業務資源的挖掘能力,這個資源就是資料。
那麼我們在實際給金融機構做資料風控的時候,確實很深刻地感受到了新的技術突破以後,會使我們對已有資源利用能力擴充套件,尤其是像我們過去幾年,大家都感受到一個是支付的變化,一個是消費金融的變化。在幾年前,我們可能經常會用現金,今天我們很少會用。現在我們會在現場去完成,這是離不開AI的技術對我們新興的各種各樣的非結構化的資料還有傳統資料之外的這些資料的解讀。 如果沒有這樣一些新的技術的突破的話,按照傳統的銀行的這些做風控、評分卡的方式,很多我們借貸的場景或者借貸的需求是沒有辦法通過的,這是第一點。
第二點,我們剛才講到了現在大多數的資料是非結構化的,比如說文字、比如說像一些影象資料、語音資料。剛才前面專家講到了我們在證券領域有一些“情緒資料”。舉例來看,就是我們在醫院看病的時候,傳統的時候我們可能看一下我們的化驗報告,一些標準的指標。慢慢地,我們的技術發展了以後,我們可以看CT片,越來越精細的掃描的片子。那麼現在其實我們在我們的一些實際的工作中,也開始用深度學習技術,把一些資料轉化成影象的格式來分析圖片。
這些新能力的出現,其實是得益於今天AI技術的發展。在整個新的資料時代,AI和資料的結合,當然還有包括雲端計算演算法的結合,會產生非常巨大的能量。我感覺現在只是一個開始。
華創資本副總裁餘振波
餘振波:先回答主持人的問題。 華創對所謂金融大資料、非金融大資料的看法:總體來講華創其實並沒有嚴格地劃一條線明確的區分什麼是金融大資料、什麼是非金融大資料。從華創的視角出發,金融大資料和非金融大資料其實並沒有非常明確的分界線。
從投資的角度去看非金融資料,需要關注的有以下幾點:
第一點,資料來源,資料的產品是不是可以規模化、標準化。這是取決於這個資料上面能長成一個標準化的產品,能夠長出一些有意思公司的先決的條件。
第二點,這個資料是不是真的有很強的解釋力和好的商業應用。比如說去預測估值的波動,比如二十天放大到兩百天,在市場的異常情況下是不是很準。這其實是比較難判斷的。
第三點,是不是有客戶真正買單。這對於創業企業來講是最重要的一條,是不是你的idea,你的觀點真的別人會認可。我們自己其實投了一家所謂的做面向二級市場投資的創業公司,叫百觀科技。
百觀科技其實就是把一些傳統的二級市場的標的,做二級市場的基本面分析的時候用不上的資料或者難以獲取的資料,用網際網路、大資料的辦法採集過來,用他們自己的模型,去做出一個產品,這個產品去賣給二級市場的投資人。其實你們可以看到從資料的產生到中間的解釋到最後有沒有人買單這樣形成了一個完整的閉環,所以我們覺得如果大家想創業的話,可以按照我剛剛所說的這三個方面去分析。
劉歡(主持人): 剛才幾位嘉賓都聊到了整合資料、採集資料,那麼在整合、採集的過程當中,我們會發現資料有多樣性的:有社交資料、電商資料、交易資料、物流軌跡資料等等,在這些多種多樣的資料裡面,如果按照商業價值來衡量的話,各位嘉賓覺得哪一類資料它的商業價值含金量或可開發、可挖掘的價值更高一些呢?
於洋:一方面要看資料的規模,但規模不是單純越大越好了。
另一方面,還得看產品的屬性和應用。客戶的需求是什麼,那麼資料種類也就相應的要適配什麼。
作為一個量化指標,它應該不是單一一類。今天講到了所謂的另類資料,其實它就是要尋求不同型別之間的資料的關係。
今天中譯語通已經為美國海外眾多知名企業提供大資料服務。今天講的資料已經不是負面新聞是怎麼樣的,一定是負面新聞的規模有多大,影響有多大,以及它和其他因素的關聯關係,不再是以一個單一主體去評價資料價值。
高強:主持人的問題其實對於資料來講,它的價值跟它的應用場景是緊密相關,所以我們如果用投資領域來講的話,其實不同的策略用到的資料不一樣,那肯定體現的價值不一樣。比如說做一些期貨的投資,可能對它來說跟期貨市場上的一些實際的市場的變化的情況或者是跟一些基本面相關。
氪信做的比較多的是銀行風控的資料,對於信貸風控來講,傳統大家用的最多的其實是信貸類的資料,也就是說徵信機構長期以來一直在積累的這些資料。這幾年資料拓展了一些維度,用到了其他的行為資料,比如說通訊的行為,比如電商消費的行為,包括日常的一些手機APP上的行為,現在大家都有在用。換句話說,不同的這些資料形成的變數對於我們最終在評估資產或者評估個人的時候,它起到的預測週期的能力是不一樣的,比如說有的變數能夠看到更長期的變化,產生更長期的變化的驅動力。有些則是短期的變化。
為什麼氪信一直講資料要整合,我們幫銀行做的是各種各樣的資料做整合。對於我們不同的金融產品,不同的借貸期限,比如說短期的,一個月或者多長的。長期一點的用到的資料不一樣,關注點也不一樣。所以這個其實跟我們的應用場景是有很大的關係的。
餘振波:從投資角度判斷資料價值有一些大的方向和判斷標準:
第一個,我們覺得最有價值的有效資料,比如說上市公司財報資料當然是非常有效的資料。
第二個,它和現有的證明有效的資料有非常強的因果關係,比如一個成熟的電商網站的UV數,跟它的GMA有非常強的因子分析,這個我們認為也會是一個比較重要的資料。
第三個,可能到不了一個很強的關係,但是有一定的相關性,需要相關性的解釋不像因果性的邏輯,很多時候需要你有創造力,或者自己新的想法,創業的機會也可能在這層資料上面。
從商業價值的角度來講,這個跟你最後做的產品是什麼樣子比較有關係,如果你的產品比較標準化,或者解釋性很強,付費的客戶又是比較有錢的客戶,比如對衝基金、銀行的,這個東西本身價值可能會大一點。
劉歡(主持人) :我追問一下餘總,剛才大家談到從客戶的角度,也有從場景運用的角度,也有從產品的角度去聊大資料風控,那從風控角度來看,大資料應用於生產流通當中,這個過程會面臨的新的風險和新的挑戰都有哪些呢?
餘振波:用在熟悉的剛才說的風控和投資面對的挑戰,最重要的挑戰有兩個:
第一個你得找到資料的用途,或者是解釋的能力到底是什麼,這個其實是一個核心的挑戰。資料的採集、整理、清洗、產品化,其並不是一個那麼需要創造力的事情,最重要的是需要找到這個資料本身的用途,或者說他本身的解釋能力在哪裡?
第二個在商業化上的挑戰。其實是怎麼樣把這個事情講給你的客戶聽,從創業的角度來講,這個是一個最重要的事情,就是你得讓客戶買單。
高強:對於另類資料來說,它的一個特別鮮明特點就是維度很高。現在大家講不管用機器學習模型,還是其他的學習模型維度越來越高,維度高的特點就是這個模型一個是解釋性差一點,另外就是它還有一個特點擬合比較好,很多時候大家看看這個擬合非常棒,這個時候大家容易產生幻覺,就像去年不管是現金貸,還是消費金融,當時很多大家覺得每天放款達到了多少萬億,然後我這個模型跑出來以後已經經過了大量樣本的檢測,而且效果非常好,這個時候大家覺得這個模型非常好,感覺到我找到了阿爾法。
其實我們做模型都知道,任何的模型其實都是一個歸納的,尤其對於開放系統的來講,開放系統任何時候拿到都是一個樣本,這個模型有它的成立背景邏輯,這個背景邏輯發生變化的時候這個就不成立了,這個時候出現非常大的、毀滅性的風險,那這個時候這個邏輯就不成立了。
在監管出來之前,已經有一些跡象,大家在做風控的時候會看到,一些指標在發生變化和遷移, 大家的容忍性越來越大,這個時候並不是說真正的是找到了阿爾法,整體行業在擴充套件的時候,我們本身賺的是貝塔的錢。 我們氪信一直和金融機構攜手深入場景做人機結合,人擅長的是做一些前瞻性、巨集觀、中觀的判斷,機器特別擅長從微觀的角度,從大量海量的資料抓細分的規律,這兩個結合起來才能用的很好。
於洋: 在未來最大的挑戰是資料合規。 我們講到社交資料、手機資料、使用者行為資料,這些資料是否合規?當你的企業需要擴大規模,需要去IPO的時候,資料的合規性是非常重要的,這是一把利劍。當然這需要一個過程,我認為資料合規就是最大的挑戰。
第二個問題,是企業的變現能力和購買能力。今天我們從使用者資料著手,對周邊的資料進行加工,這些在金融領域比較外圍的資料,變現能力和使用者的購買能力到底有多大,會達到多大的規模,這個是一個挑戰。
我覺得資料的安全,以及場景裡面的變現能力,是資料應用過程和商業變現所面臨的挑戰。
劉歡(主持人) :剛才於總提到資料的合規性,確實對於整個產業來看,大家對於資料的合規性都是非常重視的,正是因為合規性,也讓大資料產業不可避免的產生了資料孤島,產生資料融合難題,這些問題到今天來講一直也都懸而未決。關於大資料的融合,或者如何消除資料孤島的縫隙,從技術的角度,或者從商業模式的角度思考,我們能做哪些事情呢?
於洋:首先在技術上,我們講的所有金融監管科技,以及另類資料都會對行業起到很大的作用,當然並不是已經證明好的東西就一定要會顛覆掉整個行業。
舉例來看,彭博已經運轉了幾十年,所有交易員都在用老系統,大家不會為一個新生的東西把整個行業中在使用的系統更換下來,一定有一個漸變的過程。在資料合規的前提下,才可真正為金融監管,金融量化交易,企業使用者畫像等作出貢獻。
高強: 資料整合其實是一個挺難的事情。 尤其去年百行徵信出來之後,基本上定調了信貸資料要集中有一個國家主導的平臺去做這個事情,從商業角度來講,我們覺得資料整合可能的點在場景,對於現在的網際網路巨頭來說他們本身就是場景,它的資料內部打通整合已經體現出了非常強大的威力,像阿里這些已經給大家展現出來了。除此之外,在核心的企業和平臺裡面,大型企業,因為金融本身就是資訊資料驅動的行業,這些大的平臺也是資料整合,我個人不認為存在一些獨立於政府合規主導的平臺,還有大的場景之外的資料整合機會,我覺得更多的機會在場景裡面,或者大平臺。
劉歡(主持人): 目前來看,很多擁有資料和場景的巨頭開始自我生態迴圈,或者是以核心企業為主自己的產業鏈上下游去整合,這種變化只是說擴大了孤島的半徑,或者說階段性的擴大了資料應用的範圍,事實上更大的跨領域,跨行業,跨區域、跨國界的整合還很難?
高強:確實是,不過現在整個行業發展已經有改觀了。從2C這端這些平臺發展起來之後,首先我是從資訊的獲得角度講,我們已經變得很容易了,有了這些平臺以後,我想拿到一個產品的資訊非常方便。
經過這幾年發展,信用相關的資訊比以前有了很大的改進,經過這兩個階段的發展,現在整體的交易摩擦已經降了很多,也就是說資料的流動已經比以前好了很多,未來資料的整合和資料在整個經濟體裡面怎麼流動,這個涉及到相關的國家政策,包括產業的政策,還有資料隱私保護,像現在歐洲很嚴格,我相信這也是趨勢,畢竟這些資料如果沒有很好的保護,我們從國內已經發生的案例來看危害是非常大的。
劉歡(主持人): 我們剛才提到了從目前來看,資料孤島依然存在,剛才於總和高總前面已經聊到了這種趨勢在漸進趨於利好方面發展,我們在想有什麼新的技術和好的商業模式能夠 加速,或者說能夠推動這個事情更好的往前走?
餘振波:我是一個投資人,我從來不講自己是最聰明的人,我有一個信仰,商業的力量可能推動事情向好的方向發展。
舉個不太恰當的例子,這兩天“基因編輯嬰兒”事件引起輿論譁然。在倫理上我堅決反對這麼做,但是在商業背後有利益在驅動這個事情,所以我理解資料產業這個事情也一樣會是這樣,只要你有足夠多的商業需求,還有足夠多的商業利益,我覺得這個事聰明人自己會找到路線。 至於說監管也好,資料孤島也好,這個都是創業者需要去挑戰的困難,我不是說讓大家去挑戰監管,而是說你需要去跟這些限制條件做結合,要不然創業的意義在什麼地方?
如果從大的趨勢去講,資料的生成,資料本身的產業化,所有的大資料、人工智慧技術的進步來講肯定給人類帶來更多的福祉,這個我相信一定是這樣子,我也希望知道下一個最好的商業模式是什麼,我也希望知道下一個非常優秀的創業者在哪裡。
劉歡(主持人):過程很艱難,但是結果很美好。
於洋:分享一點中譯語通的經驗。我們在2015年提出了跨語言大資料的概念,跨語言一定不代表著把這個東西翻譯成中文,這些資料可能之前是英文的、中文的、日文的、法文的,對於我們來說, 首先語言是一個問題,傳導不過去,就會失去很多的金融機會。
第二點,當解決語言問題之後,資料影響和波及的規模有多大,情緒的正面、負面,市場和投資人的行為怎麼樣衡量,這個是很重要的。
中譯語通提出了13種自然語言處理的演算法,我們覆蓋了大概超過12種語言,也就是說,當我們在分析俄羅斯、德國這些國家自然語言的演算法的時候,都是要用它的本語言去計算,識別出它的語義和觀點。
解決不同資料、不同語言之間的資訊對稱,從這個層面上,我覺得還是一個特別巨大的空間。
劉歡(主持人): 感謝於總。因為時間關係,最後一個問題,大家一句話總結一下,不管是自己行業內的也好,或者自己所處的行業,各位嘉賓覺得金融產業在2019年最明顯的機會是什麼?
於洋: 另類資料就是新石油。
高強:這個還是挺有難度的, 2019年像銀行消費金融這類機構,用一句話概括的話 :大家會以一種更敏捷的姿態,以資料驅動的方式更好地以客戶為中心做好金融服務。
餘振波:從投資的角度來講,我覺得資料這個產業現在處在一個既不算元年,但也不算格局已定,它所處的狀態混沌初開。所以還是希望有更多的創業者能夠用更創新的商業模式來打動我。
版權宣告
凡來源為億歐網的內容,其版權均屬北京億歐網盟科技有限公司所有。文章內容系作者個人觀點,不代表億歐對觀點贊同或支援。