㈠ 大數據技術在金融行業有哪些應用前景
大數據金融市場前景廣闊,深度開發大數據金融工具,或將重構整個金融行業。預計未來5到10年,金融大數據產業將迎來黃金增長期,大數據也將成為助推「大眾創業、萬眾創新」浪潮的有力抓手。
據《大數據金融行業市場前瞻與投資分析報告》數據顯示,2016年我國大數據金融市場規模為15.84億元,隨著政策逐步實施與落地,以大數據為核心手段、核心驅動力的產業金融,將邁入時代發展正軌成為主流趨勢,預計2018年中國金融大數據應用市場會突破100億元,金融業開始進入了大數據時代快車道。
大數據金融作為一個綜合性的概念,在未來的發展中,企業坐擁數據將不再局限於單一業務,第三方支付、信息化金融機構以及互聯網金融門戶都將融入到大數據金融服務平台中,大數據金融服務將在各家機構各顯神通的基礎上,實現多元業務的融合。
伴隨互聯網金融縱深發展,大數據優勢越加凸顯。作為互聯網金融創新的驅動力,大數據金融帶來的方式革新,未來走向精細化和專業化。今後大數據金融行業的努力方向,應該是以完備的大數據為基礎,基於用戶需求提供智能化一站式產品購買及定製化服務,以及數據挖掘、數據整合、數據產品、數據應用及解決方案等。
㈡ 大數據技術在金融行業中的典型應用
大數據技術在金融行業中的典型應用
近年來,我國金融科技快速發展,在多個領域已經走在世界前列。大數據、人工智慧、雲計算、移動互聯網等技術與金融業務深度融合,大大推動了我國金融業轉型升級,助力金融更好地服務實體經濟,有效促進了金融業整體發展。在這一發展過程中,又以大數據技術發展最為成熟、應用最為廣泛。從發展特點和趨勢來看,「金融雲」快速建設落地奠定了金融大數據的應用基礎,金融數據與其他跨領域數據的融合應用不斷強化,人工智慧正在成為金融大數據應用的新方向,金融行業數據的整合、共享和開放正在成為趨勢,給金融行業帶來了新的發展機遇和巨大的發展動力。
大數據在金融行業的典型應用場景
大數據涉及的行業過於廣泛,除金融外,還包括政治、教育、傳媒、醫學、商業、工農業、互聯網等多個方面,各行業對大數據的定義目前尚未統一。大數據的特點可歸納為「4V」。第一,數據體量大(Volume),海量性也許是與大數據最相關的特徵。第二,數據類型繁多(Variety),大數據既包括以事務為代表的傳統結構化數據,還包括以網頁為代表的半結構化數據和以視頻、語音信息為代表的非結構化數據。第三,價值密度低(Value),大數據的體量巨大,但數據中的價值密度卻很低。比如幾個小時甚至幾天的監控視頻中,有價值的線索或許只有幾秒鍾。第四,處理速度快(Velocity),大數據要求快速處理,時效性強,要進行實時或准實時的處理。
金融行業一直較為重視大數據技術的發展。相比常規商業分析手段,大數據可以使業務決策具有前瞻性,讓企業戰略的制定過程更加理性化,實現生產資源優化分配,依據市場變化迅速調整業務策略,提高用戶體驗以及資金周轉率,降低庫存積壓的風險,從而獲取更高的利潤。
當前,大數據在金融行業典型的應用場景有以下幾個方面:
在銀行業的應用主要表現在兩個方面:一是信貸風險評估。以往銀行對企業客戶的違約風險評估多基於過往的信貸數據和交易數據等靜態數據,內外部數據資源整合後的大數據可提供前瞻性預測。二是供應鏈金融。利用大數據技術,銀行可以根據企業之間的投資、控股、借貸、擔保及股東和法人之間的關系,形成企業之間的關系圖譜,利於企業分析及風險控制。
在證券行業的應用主要表現為:一是股市行情預測。大數據可以有效拓寬證券企業量化投資數據維度,幫助企業更精準地了解市場行情,通過構建更多元的量化因子,投研模型會更加完善。二是股價預測。大數據技術通過收集並分析社交網路如微博、朋友圈、專業論壇等渠道上的結構化和非結構化數據,形成市場主觀判斷因素和投資者情緒打分,從而量化股價中人為因素的變化預期。三是智能投資顧問。智能投資顧問業務提供線上投資顧問服務,其基於客戶的風險偏好、交易行為等個性化數據,依靠大數據量化模型,為客戶提供低門檻、低費率的個性化財富管理方案。
在互聯網金融行業的應用,一是精準營銷。大數據通過用戶多維度畫像,對客戶偏好進行分類篩選,從而達到精準營銷的目的。二是消費信貸。基於大數據的自動評分模型、自動審批系統和催收系統可降低消費信貸業務違約風險。
金融大數據的典型案例分析
為實時接收電子渠道交易數據,整合銀行內系統業務數據。中國交通銀行通過規則欲實現快速建模、實時告警與在線智能監控報表等功能,以達到實時接收官網業務數據,整合客戶信息、設備畫像、位置信息、官網交易日誌、瀏覽記錄等數據的目的。
該系統通過為交通銀行卡中心構建反作弊模型、實時計算、實時決策系統,幫助擁有海量歷史數據,日均增長超過兩千萬條日誌流水的銀行卡中心,形成電子渠道實時反欺詐交易監控能力。利用分布式實時數據採集技術和實時決策引擎,幫助信用卡中心高效整合多系統業務數據,處理海量高並發線上行為數據,識別惡意用戶和欺詐行為,並實時預警和處置;通過引入機器學習框架,對少量數據進行分析、挖掘構建並周期性更新反欺詐規則和反欺詐模型。
系統上線後,該銀行迅速監控電子渠道產生的虛假賬號、偽裝賬號、異常登錄、頻繁登錄等新型風險和欺詐行為;系統穩定運行,日均處理逾兩千萬條日誌流水、實時識別出近萬筆風險行為並進行預警。數據接入、計算報警、案件調查的整體處理時間從數小時降低至秒級,監測時效提升近3000倍,上線3個月已幫助卡中心挽回數百萬元的風險損失。
網路的搜索技術正在全面注入網路金融。網路金融使用的梯度增強決策樹演算法可以分析大數據高維特點,在知識分析、匯總、聚合、提煉等多個方面有其獨到之處,其深度學習能力利用數據挖掘演算法能夠較好地解決大數據價值密度低等問題。網路「磐石」系統基於每日100億次搜索行為,通過200多個維度為8.6億賬號精確畫像,高效劃分人群,能夠為銀行、互聯網金融機構提供身份識別、反欺詐、信息檢驗、信用分級等服務。該系統累計為網路內部信貸業務攔截數十萬欺詐用戶,攔截數十億不良資產、減少數百萬人力成本,累計合作近500家社會金融機構,幫助其提升了整體風險防控水平。
金融大數據應用面臨的挑戰及對策
大數據技術為金融行業帶來了裂變式的創新活力,其應用潛力有目共睹,但在數據應用管理、業務場景融合、標准統一、頂層設計等方面存在的瓶頸也有待突破。
一是數據資產管理水平仍待提高。主要體現在數據質量不高、獲取方式單一、數據系統分散等方面。
二是應用技術和業務探索仍需突破。主要體現在金融機構原有的數據系統架構相對復雜,涉及的系統平台和供應商較多,實現大數據應用的技術改造難度很大。同時,金融行業的大數據分析應用模型仍處於起步階段,成熟案例和解決方案仍相對較少,需要投入大量的時間和成本進行調研和試錯。系統誤判率相對較高。
三是行業標准和安全規范仍待完善。金融大數據缺乏統一的存儲管理標准和互通共享平台,對個人隱私的保護上還未形成可信的安全機制。
四是頂層設計和扶持政策還需強化。體現在金融機構間的數據壁壘較為明顯,各自為戰問題突出,缺乏有效的整合協同。同時,行業應用缺乏整體性規劃,分散、臨時、應激等特點突出,信息價值開發仍有較大潛力。
以上問題,一方面需要國家出台促進金融大數據發展的產業規劃和扶持政策,同時,也需要行業分階段推動金融數據開放、共享和統一平台建設,強化行業標准和安全規范。只有這樣,大數據技術才能在金融行業中穩步應用發展,不斷推動金融行業的發展提升。
㈢ 大數據如何推動金融業的商業變革
大數據如何推動金融業的商業變革
商業無論是接受還是拒絕,中國金融業的大數據時代正在呼嘯而至。據調查,經過多年的發展與積累,目前很多國內金融機構的數據量級已經達到100TB以上。而且,非結構化數據量正在以更快的速度增長。在高數據強度的金融行業,這一發展激起了巨大的想像空間。然而,要抓住這一機遇並非易事。
我們系統梳理了大數據在全球金融行業的發展現狀、潛在應用、關鍵瓶頸及應對方案,旨在協助金融機構從價值的角度更好地理解大數據,並在大數據迅速滲入金融業務各個層面的當下抓住發展機遇。大數據引領金融機構變革主要體現在哪些方面?成就大數據的不僅是傳統定義中的「三個V」,即數量(Volume)、速度(Velocity)和種類(Variety)。對金融機構而言,更重要的是第四個V,即價值(Value)。大數據的價值不僅體現在對金融機構財務相關指標的直接影響上,也體現在對商業模式變革的推動能力上,即不斷引發傳統金融機構的內嵌式變革。大數據從四個方面改變了金融機構傳統的數據運作方式,從而實現了巨大的商業價值。這四個方面(「四個C」)包括:數據質量的兼容性(Compatibility)、數據運用的關聯性(Connectedness)、數據分析的成本(Cost)以及數據價值的轉化(Capitalization)。大數據推動銀行的變革主要體現在價值層面上數據技術與數據經濟的發展是持續實現大數據價值的支撐。深度應用正在將傳統IT從「後端」不斷推向「前台」,而存量架構與創新模塊的有效整合是傳統金融機構在技術層面所面臨的主要挑戰。此外,數據生態的發展演進有其顯著的社會特徵。作為其中的一員,金融機構在促進數據經濟的發展上任重道遠。為了駕馭大數據,國內金融機構要在技術的基礎上著重引入以價值為導向的管理視角,最終形成自上而下的內嵌式變革。其中的三個關鍵點(「TMT」)包括:團隊(Team)、機制(Mechanism)和思維(Thinking)。大數據是什麼?在這個問題上,國內目前常用的是「3V」定義,即數量(Volume)、速度(Velocity)和種類(Variety)。雖然有著這樣的定義,但人們從未停止討論什麼才是成就大數據的「關鍵節點」。人們熱議的焦點之一是「到底多大才算是大數據?」其實這個問題在「量」的層面上並沒有絕對的標准,因為「量」的大小是相對於特定時期的技術處理和分析能力而言的。在上個世紀90年代,10GB的數據需要當時計算能力一流的計算機處理幾個小時,而這個量現在只是一台普通智能手機存儲量的一半而已。在這個層面上頗具影響力的說法是,當「全量數據」取代了「樣本數據」時,人們就擁有了大數據。海量的數據為銀行的發展提升了價值另外一個成為討論焦點的問題是,今天的海量數據都來源於何處。在商業環境中,企業過去最關注的是ERP(Enterprise Resource Planning)和CRM(Customer Relationship Management)系統中的數據。這些數據的共性在於,它們都是由一個機構有意識、有目的地收集到的數據,而且基本上都是結構化數據。隨著互聯網的深入普及,特別是移動互聯網的爆發式增長,人機互動所產生的數據已經成為了另一個重要的數據來源,比如人們在互聯網世界中留下的各種「數據足跡」。但所有這些都還不是構成「大量數據」的主體。「3V」的定義專注於對數據本身的特徵進行描述。然而,是否是量級龐大、實時傳輸、格式多樣的數據就是大數據?成就大數據的關鍵點在於「第四個V」,即價值(Value)。當量級龐大、實時傳輸、格式多樣的全量數據通過某種手段得到利用並創造出商業價值,而且能夠進一步推動商業模式的變革時,大數據才真正誕生。大數據運作如何推動金融業變革?多元化格式的數據已呈海量爆發,人類分析、利用數據的能力也日益精進,我們已經能夠從大數據中創造出不同於傳統數據挖掘的價值。那麼,大數據帶來的「大價值」究竟是如何產生的?無論是在金融企業還是非金融企業中,數據應用及業務創新的生命周期都包含五個階段:業務定義需求;IT部門獲取並整合數據;數據科學家構建並完善演算法與模型;IT發布新洞察;業務應用並衡量洞察的實際成效。在今天的大數據環境下,生命周期仍維持原樣,而唯一變化的是「數據科學家」在生命周期中所扮演的角色。大數據將允許其運用各種新的演算法與技術手段,幫助IT不斷挖掘新的關聯洞察,更好地滿足業務需求。大數據延長了金融機構的生命周期大數據改變的並不是傳統數據的生命周期,而是具體的運作模式。在傳統的數據基礎和技術環境下,這樣的周期可能要經歷一年乃至更長的時間。但是有了現在的數據量和技術,機構可能只需幾周甚至更短的時間就能走完這個生命周期。新的數據運作模式使快速、低成本的試錯成為可能。這樣,商業機構就有條件關注過去由於種種原因而被忽略的大量「小機會」,並將這些「小機會」累積形成「大價值」。
㈣ 大數據和人工智慧在互聯網金融領域有哪些應用
大數據從四個方面改變了金融機構傳統的數據運作方式,從而實現了巨大的商業價值。這四個方面(「四個C」)包括:數據質量的兼容性(Compatibility)、數據運用的關聯性(Connectedness)、數據分析的成本(Cost)以及數據價值的轉化(Capitalization)。
大數據在金融業的應用場景正在逐步拓展。在海外,大數據已經在金融行業的風險控制、運營管理、銷售支持和商業模式創新等領域得到了全面嘗試。在國內,金融機構對大數據的應用還基本處於起步階段。數據整合和部門協調等關鍵環節的挑戰仍是阻礙金融機構將數據轉化為價值的主要瓶頸。
數據技術與數據經濟的發展是持續實現大數據價值的支撐。深度應用正在將傳統IT從「後端」不斷推向「前台」,而存量架構與創新模塊的有效整合是傳統金融機構在技術層面所面臨的主要挑戰。此外,數據生態的發展演進有其顯著的社會特徵。作為其中的一員,金融機構在促進數據經濟的發展上任重道遠。
無論是在金融企業還是非金融企業中,數據應用及業務創新的生命周期都包含五個階段:業務定義需求;IT部門獲取並整合數據;數據科學家構建並完善演算法與模型;IT發布新洞察;業務應用並衡量洞察的實際成效。
在今天的大數據環境下,生命周期仍維持原樣,而唯一變化的是「數據科學家」在生命周期中所扮演的角色。大數據將允許其運用各種新的演算法與技術手段,幫助IT不斷挖掘新的關聯洞察,更好地滿足業務需求。
㈤ 大數據在金融行業的應用與挑戰
大數據在金融行業的應用與挑戰
A 具有四大基本特徵
金融業基本是全世界各個行業中最依賴於數據的,而且最容易實現數據的變現。全球最大的金融數據公司Bloomberg在1981年成立時「大數據」概念還沒有出現。Bloomberg的最初產品是投資市場系統(IMS),主要向各類投資者提供實時數據、財務分析等。
隨著信息時代降臨,1983年估值僅1億美元的Bloomberg以30%股份的代價換取美林3000萬美元投資,先後推出Bloomberg Terminal、News、Radio、TV等各類產品。1996年Bloomberg身價已達20億美元,並以2億美元從美林回購了10%的股份。2004年Bloomberg在紐約曼哈頓中心建成246米摩天高樓。到2008年次貸危機,美林面臨崩盤,其剩餘20%的Bloomberg股份成為救命稻草。Bloomberg趁美林之危贖回所有股份,估值躍升至225億美元。2016年Bloomberg全球布局192個辦公室,擁有1.5萬名員工,年收入約100億美元,估值約1000億美元,超過同年市值為650億美元的華爾街標桿高盛。
大數據概念形成於2000年前後,最初被定義為海量數據的集合。2011年,美國麥肯錫公司在《大數據的下一個前沿:創新、競爭和生產力》報告中最早提出:大數據指大小超出典型資料庫軟體工具收集、存儲、管理和分析能力的數據集。
具體來說,大數據具有四大基本特徵:
一是數據體量大,指代大型數據集,一般在10TB規模左右,但在實際應用中,很多企業用戶把多個數據集放在一起,已經形成了PB級的數據量。
二是數據類別大,數據來自多種數據源,數據種類和格式日漸豐富,已沖破了以前所限定的結構化數據范疇,囊括了半結構化和非結構化數據。現在的數據類型不僅是文本形式,更多的是圖片、視頻、音頻、地理位置信息等多類型的數據。
三是處理速度快,在數據量非常龐大的情況下,也能夠做到數據的實時處理。數據處理遵循「1秒定律」,可從各種類型的數據中快速獲得高價值的信息。
四是數據的真實性高,隨著社交數據、企業內容、交易與應用數據等新數據源的興起,傳統數據源的局限被打破,信息的真實性和安全性顯得極其重要。
而相比其他行業,金融數據邏輯關系緊密,安全性、穩定性和實時性要求更高,通常包含以下關鍵技術:數據分析,包括數據挖掘、機器學習、人工智慧等,主要用於客戶信用、聚類、特徵、營銷、產品關聯分析等;數據管理,包括關系型和非關系型數據、融合集成、數據抽取、數據清洗和轉換等;數據使用,包括分布式計算、內存計算、雲計算、流處理、任務配置等;數據展示,包括可視化、歷史流及空間信息流展示等,主要應用於對金融產品健康度、產品發展趨勢、客戶價值變化、反洗錢反欺詐等監控和預警。
B 重塑金融行業競爭新格局
「互聯網+」之後,隨著世界正快速興起「大數據+」,金融行業悄然出現以下變化:
大數據特徵從傳統數據的「3個V」增加到「5個V」。在數量(Volume)、速度(Velocity)、種類(Variety)基礎上,進一步完善了價值(Value)和真實性(Veracity),真實性包括數據的可信性、來源和信譽、有效性和可審計性等。
金融業按經營產品分類變為按運營模式分類。傳統金融業按經營產品劃分為銀行、證券、期貨、保險、基金五類,隨著大數據產業興起和混業經營的發展,現代金融業按運營模式劃分為存貸款類、投資類、保險類三大類別。
大數據市場從壟斷演變為充分市場競爭。全球大數據市場企業數量迅速增多,產品和服務的差異增大,技術門檻逐步降低,市場競爭日益激烈。行業解決方案、計算分析服務、存儲服務、資料庫服務和大數據應用成為市場份額排名最靠前的五大細分市場。
大數據形成新的經濟增長點。Wikibon數據顯示,2016年,全球大數據硬體、軟體和服務整體市場增長22%達到281億美元,預計到2027年,全球在大數據硬體、軟體和服務上的整體開支的復合年增長率為12%,將達到大約970億美元。
數據和IT技術替代「重復性」業務崗位。數據服務公司Eurekahedge通過追蹤23家對沖基金,發現5位對沖基金經理薪金總額為10億美元甚至更高。過去10年,靠數學模型分析金融市場的物理學家和數學家「寬客」一直是對沖基金的寵兒,其實大數據+人工智慧更精於此道。高盛的紐約股票現金交易部門2000年有600名交易員而如今只剩兩人,其任務全由機器包辦,專家稱10年後高盛員工肯定比今天還要少。
美國大數據發展走在全球前列。美國政府宣稱:「數據是一項有價值的國家資本,應對公眾開放,而不是將其禁錮在政府體制內。」作為大數據的策源地和創新引領者,美國大數據發展一直走在全球最前列。自20世紀以來,美國先後出台系列法規,對數據的收集、發布、使用和管理等做出具體的規定。2009年,美國政府推出Data.gov政府數據開放平台,方便應用領域的開發者利用平台開發應用程序,滿足公共需求或創新創業。2010年,美國國會通過更新法案,進一步提高了數據採集精度和上報頻度。2012年3月,奧巴馬政府推出《大數據研究與開發計劃》,大數據迎來新一輪高速發展。
英國是歐洲金融中心,大數據成為其領先科技之一。2013年,英國投資1.89億英鎊發展大數據。2015年,新增7300萬英鎊,創建了「英國數據銀行」data.gov.uk網站。2016年,倫敦舉辦了超過22000場科技活動,同年,英國數字科技投資逾68億英鎊,而收入則超過1700億英鎊。另外,英國統計局利用政府資源開展「虛擬人口普查」,僅此一項每年節省5億英鎊經費。
C 打造高效金融監管體系
大數據用已發生的總體行為模式和關聯邏輯預測未來,決策未來,作為現代數字科技的核心,其靈魂就是——預測。
偵測、打擊逃稅、洗錢與金融詐騙
全球每年因欺詐造成的經濟損失約3.7萬億美元,企業因欺詐受損通常為年營收額的5%。全球最大軟體公司之一美國SAS公司與稅務、海關等政府部門和全球各國銀行、保險、醫療保健等機構合作,有效應對日益復雜化的金融犯罪行為。如在發放許可之前,通過預先的數據分析檢測客戶是否有過行受賄、欺詐等前科,再確定是否發放借貸或海關通關。SAS開發的系統已被國際公認為統計分析的標准軟體,在各領域廣泛應用。英國政府利用大數據檢測行為模式檢索出200億英鎊的逃稅與詐騙,追回了數十億美元損失。被福布斯評為美國最佳銀行的德克薩斯資本銀行(TCBank),不斷投資大數據技術,反金融犯罪系統與銀行發展同步,近3年資產從90億美元增至210億美元。荷蘭第三大人壽保險公司CZ依靠大數據對騙保和虛假索賠行為進行偵測,在支付賠償金之前先期阻斷,有效減少了欺詐發生後的司法補救。
大數據風控建立客戶信用評分、監測對照體系
美國注冊舞弊審核師協會(ACFE)統計發現,缺乏反欺詐控制的企業會遭受高額損失。美國主流個人信用評分工具FICO能自動將借款人的歷史資料與資料庫中全體借款人總體信用習慣相比較,預測借款人行為趨勢,評估其與各類不良借款人之間的相似度。美國SAS公司則通過集中瀏覽和分析評估客戶銀行賬戶的基本信息、歷史行為模式、正在發生行為模式(如轉賬)等,結合智能規則引擎(如搜索到該客戶從新出現的國家為特有用戶轉賬,或在新位置在線交易等),進行實時反欺詐分析。
美國一家互聯網信用評估機構通過分析客戶在Facebook、Twitter等社交平台留下的信息,對銀行的信貸和投保申請客戶進行風險評估,並將結果出售給銀行、保險公司等,成為多家金融機構的合作夥伴。
D 數據整合困難
應用經濟指標預測系統分析市場走勢
IBM使用大數據信息技術成功開發了「經濟指標預測系統」,該系統基於單體數據進行提煉整合,通過搜索、統計、分析新聞中出現的「新訂單」等與股價指標有關的單詞來預測走勢,然後結合其他相關經濟數據、歷史數據分析其與股價的關系,從而得出行情預測結果。
追蹤社交媒體上的海量信息評估行情變化
當今搜索引擎、社交網路和智能手機上的微博、微信、論壇、新聞評論、電商平台等每天生成幾百億甚至千億條文本、音像、視頻、數據等,涵蓋廠商動態、個人情緒、行業資訊、產品體驗、商品瀏覽和成交記錄、價格走勢等,蘊含巨大財富價值。
2011年5月,規模為4000萬美元的英國對沖基金DC Markets,通過大數據分析Twitter的信息內容來感知市場情緒指導投資,首月盈利並以1.85%的收益率一舉戰勝其他對沖基金僅0.76%的平均收益率。
美國佩斯大學一位博士則利用大數據追蹤星巴克、可口可樂和耐克公司在社交媒體的圍觀程度對比其股價,證明Facebook、Twitter和 Youtube上的粉絲數與股價密切相關。
提供廣泛的投資選擇和交易切換
日本個人投資理財產品Money Design在應用程序Theo中使用演算法+人工智慧,最低門檻924美元,用戶只需回答風險承受水平、退休計劃等9個問題,就可使用35種不同貨幣對65個國家的1.19萬只股票進行交易和切換,年度管理費僅1%。Money Design還能根據用戶投資目標自動平衡其賬戶金額,預計2020年將超過2萬億美元投資該類產品。
利用雲端資料庫為客戶提供記賬服務
日本財富管理工具商Money Forward提供雲基礎記賬服務,可管理工資、收付款、寄送發票賬單、針對性推送理財新項目等,其軟體系統連接並整合了2580家各類金融機構的各類型帳戶,運用大數據分析的智能儀表盤顯示用戶當前財富狀況,還能分析用戶以往的數據以預測未來的金融軌跡。目前其已擁有50萬商家和350萬個體用戶,並與市值2.5萬億美元的山口金融集團聯合開發新一款APP。
為客戶定製差異化產品和營銷方案
金融機構迫切需要掌握更多用戶信息,繼而構建用戶360度立體畫像,從而對細分客戶進行精準營銷、實時營銷、智慧營銷。
一些海外銀行圍繞客戶「人生大事」,分析推算出大致生活節點,有效激發其對高價值金融產品的購買意願。如一家澳大利亞銀行通過大數據分析發現,家中即將誕生嬰兒的客戶對壽險產品的潛在需求最大,於是通過銀行卡數據監控准媽媽開始購買保胎葯品和嬰兒相關產品等現象,識別出即將添丁的家庭,精準推出定製化金融產品套餐,受到了客戶的積極響應,相比傳統的簡訊群發模式大幅提高了成功率。
催生並支撐人工智慧交易
「量化投資之王」西蒙斯被公認為是最能賺錢的基金經理人,自1988年創立文藝復興科技公司的旗艦產品——大獎章基金以來,其憑借不斷更新完善的大數據分析系統,20年中創造出35%的年均凈回報率,比索羅斯同期高10%,比股神巴菲特同期高18%,成為有史以來最成功的對沖基金,並於1993年基金規模達2.7億美元時停止接受新投資。在美國《Alpha》雜志每年公布的對沖基金經理排行榜上,西蒙斯2005年、2006年分別以15億美元、17億美元凈收入穩居全球之冠,2007年以13億美元位列第五,2008年再以25億美元重返榜首。
推動金融產品和服務創新
E 面臨三大挑戰
目前,全球各行業數據量的增長速度驚人,在我國尤其集中在金融、交通、電信、製造業等重點行業,信息化的不斷深入正在進一步催生更多新的海量數據。
據統計,2015年中國的數據總量達到1700EB以上,同比增長90%,預計到2020年這一數值將超過8000EB。以銀行業為例,每創收100萬元,銀行業平均產生130GB的數據,數據強度高踞各行業之首。但在金融企業內部數據處於割裂狀態,業務條線、職能部門、渠道部門、風險部門等各個分支機構往往是數據的真正擁有者,缺乏順暢的共享機制,導致海量數據往往處於分散和「睡眠」狀態,雖然金融行業擁有的數據量「富可敵國」,但真正利用時卻「捉襟見肘」。
數據安全暗藏隱患
大數據本質是開放與共享,但如何界定、保護個人隱私權卻成為法律難題。大數據存儲、處理、傳輸、共享過程中也存在多種風險,不僅需要技術手段保護,還需相關法律法規規范和金融機構自律。多項實際案例表明,即使無害的數據大量囤積也會滋生各種隱患。安全保護對象不僅包括大數據自身,也包含通過大數據分析得出的知識和結論。在線市場平台英國Handshake.uk.com就嘗試允許用戶協商個人數據被品牌分享所得的報酬。
人才梯隊建設任重道遠
人才是大數據之本。與信息技術其他細分領域人才相比,大數據發展對人才的復合型能力要求更高,需要掌握計算機軟體技術,並具備數學、統計學等方面知識以及應用領域的專業知識。
㈥ 大數據風控在金融科技中的應用和問題
大數據風控在金融科技中的應用和問題
一、為什麼要用大數據風控?
不論是銀行還是消費金融公司,互聯網小貸公司等其他金融機構,金融機構普遍有風控需求,底層業務邏輯幾乎完全相同,只是面對客群,金融產品、風險偏好存在差異。
銀行等傳統機構本質上是風險經營。一方面,監管層對金融機構的風控能力提出很高要求, 另一方面,風控直接會影響金融機構的利潤水平。
因此,大數據風控直接解決金融機構的核心需求,價值度最大。大數據風控能夠能夠在用戶畫像,反欺詐,信用評級等方面大大提高金融機構的效率和風控能力,是金融企業發展過程中必須結合的一項科技手段。
二、大數據產業情況介紹
目前大數據行業主要有三類玩家:
以人行徵信、鵬元徵信、前海徵信、銀聯智策為主的數據機構,他們特點是和傳統的銀行,公安部,工商局,航空公司,社保局等國家機關合作,提供公民基本身份證信息、銀行卡信息、航空出行信息、企業工商信息等,他們的特點是對外提供數據查詢,數據豐富有價值,缺點是風控產品偏弱。以螞蟻金服、騰訊徵信、網路金融為主的互聯網公司,他們的特點是各自都有一塊基於電商、社交、搜索的巨量數據,同時一些外部數據,形成自己的風控產品和數據輸出能力,這些互聯網公司剛開始只是和自己的戰略合作企業合作輸出風控,現在也慢慢對外提供2B的風控產品。同盾科技、百融金服、幫盛科技、聚信立、數美科技等創業技術公司,在互聯網巨頭還沒有對外提供風控技術和傳統數據機構風控技術還不強的時候,他們的出現彌補了P2P金融和現金貸對風控產品的巨大需求,他們的數據是整合多方數據源,不斷的為2B企業提供風控模型和數據,並且獲得了一些網貸數據積累。
三、大數據風控的覆蓋流程
大數據覆蓋信貸領域各個流程,重點是獲客、身份驗證和授信環節,貸中後環節。
獲客環節建立用戶畫像,跟蹤用戶完整生命周期;身份驗證環節,通過身份驗證,活體識別等技術解決申請人是否本人的問題,關聯分析則是利用圖關聯技術,找出欺詐團伙;授信環節匯聚多方數據源,通過建模進行風險定價,金融科技服務商輸出信用評分給機構使用;貸中後環節,主要是排查異常客戶,及時報警,以及逾期客戶失聯修復等。
大數據在信貸過程中的應用
四、大數據風控的價值點分析
1.數據
大數據風控中什麼是最重要的?
答案是:數據。
數據的大數據風控中的核心中的核心,沒有什麼比數據直接告訴金融機構某個目標客戶是黑名單客戶,逾期嚴重客戶更簡單和高效的事情了。
數據最好能有海量數據,覆蓋足夠多的用戶;用戶數據價值密度高、噪音少,數據清洗容易;用戶數據維度多,能夠形成豐富的用戶畫像;自身業務場景能夠獲取有價值數據 。
2.技術
對於有些金融機構來講,如果風控標准很嚴格,其實排查不能准入的客戶其實是不難的,但是對於大部分金融機構來講,風控和業務是互斥的,為了提高業務量,就必須降低准入標准,但是又要防範風險,這就需要藉助技術手段,通過反欺詐建模和信用建模方式,對一下白戶進行評估,以及評估客戶信用水平,以決定是否准入。
技術要求有強大的底層技術架構能力,良好的企業級產品輸出能力和大數據清洗和建模能力,未來還需要結合Al等技術,形成智能的風控和反欺詐平台。
3.場景
理財,保險,汽車金融,現金貸等金融服務,對應的場景不同,對建模的要求也不同,建模能力要求對客戶的業務場景非常理解,模型才能適合行業特徵。需要經驗豐富的建模團隊和行業專家隊伍;服務過行業標桿客戶,了解客戶的業務場景;深度理解業務需求。
五、大數據風控的在信貸中應用
我們以百融系統為例,介紹大數據風控在信貸過程中的流程:
百融大數據風控應用貸款流程
當前的信貸審批流程主要分為人工審核和自動審核,對於客戶資質好,信用好的客戶,只要能通過負面信息,欺詐信息,信用評估,那麼系統自 動審批通過。對負面信息和欺詐風險沒有通過的客戶,系統可以自動拒絕或者申請人工復核,對於信用評分不高的客戶,需要人工介入審核。
六、常用的大數據行業數據
央行徵信報告:一般持牌金融機構有央行徵信介入許可權,包括個人的執業資格記錄、行政獎勵和處罰記錄、法院訴訟和強制執行記錄、欠稅記錄等。司法信息:最高法以及省市各級法院的最新公布名單,包括執行法院、立案時間、執行案號、執行標的、案件狀態、執行依據、執行機構、生效法律文書確定的義務、被執行人的履行情況、失信被執行人的行為等信息。公安信息:覆蓋公安系統涉案、在逃和有案底人員信息,包括案發時間、案件詳情如詐騙案/生產、銷售假葯案等信息。信用卡信息:銀行儲蓄卡/信用卡支出、收入、 逾期等信息。航旅信息:包含過去一年中,每個季度的飛行城市、飛行次數、座位層次等數據。社交信息:包含社交賬號匹配類型、社交賬號性別、社交賬號粉絲數等。運營商信息:核查運營商賬戶在網時長、在網狀態、消費檔次等信息。網貸黑名單:根據個人姓名和身份證號碼驗證是否有網貸逾期,黑名單信息。還有駕駛證狀態,租車黑名單,電商消費記錄等等。
七、大數據行業存在的問題
目前整個大數據行業面臨的問題主要是客戶隱私泄露問題,像公安,法院等信息由於信息敏感,其實是遊走在法律監管空白地帶。
在百行徵信成立之前,各家數據機構的數據其實沒有打通,數據的有效性會打折扣,預計百行徵信數據出來之後,因為結合了各家數據之長,數據連貫性會好一些。
各個大數據公司在數據收集和清洗方式不同,會造成數據污染,這樣輸出的數據會有一定的不準確性。
目前公民數據主要來自於線下收集和網路行為記錄,數據的存在一定的滯後性,單純線下收集的數據存在一定的延遲性。
大數據還處於發展初期,目前比較大的問題還是數據量不夠大,不夠全,以及如何協調數據開放和公民隱私之間的矛盾,未來還需要結合人工智慧和區塊鏈,物聯網等技術,實現數據的不可篡改,數據收集及時等能力,從而更好為金融服務。