壹、為什麽要用大數據風控?
無論是銀行還是消費金融公司、互聯網小貸公司等金融機構,金融機構普遍存在風險控制需求,底層業務邏輯幾乎壹致,但對客戶的金融產品和風險偏好存在差異。
銀行等傳統機構本質上是風險管理。壹方面,監管部門對金融機構的風險控制能力提出了很高的要求。另壹方面,風險控制將直接影響金融機構的利潤水平。
所以大數據風控直接解決了金融機構的核心需求,價值最大。大數據風控可以大大提高金融機構在用戶畫像、反欺詐、信用評級等方面的效率和風控能力,是金融企業發展中必須結合的科技手段。
二、大數據產業的引入
目前,大數據行業主要有三類玩家:
以人民銀行征信、鵬遠征信、前海征信、銀聯智慧策為主的數據機構,特點是與傳統銀行、公安部、工商局、航空公司、社保局等國家機關合作,為公民提供基本的身份證信息、銀行卡信息、航空出行信息、企業工商信息等。他們的特點是對外提供數據查詢,數據豐富有價值,缺點是風控產品薄弱。以螞蟻金服、騰訊征信、百度金融為主的互聯網公司,各自擁有基於電商、社交、搜索的海量數據,部分外部數據形成自身的風控產品和數據輸出能力。壹開始這些互聯網公司只是和自己的戰略合作企業合作輸出風控,現在慢慢的在對外提供2B風控產品。同盾科技、白蓉金夫、盛邦科技、聚信利、舒眉科技等創業型科技公司,在互聯網巨頭尚未對外提供風控技術、傳統數據機構風控技術不強的情況下,彌補了P2P金融、現金貸對風控產品的巨大需求。他們的數據是整合多個數據源,持續為2B企業提供風控模型和數據,獲得部分網貸數據積累。
三、大數據風控的覆蓋流程
大數據覆蓋信貸領域的所有流程,重點關註獲客、身份驗證和授信、貸後環節。
在獲客環節建立用戶畫像,追蹤用戶完整生命周期;在認證環節,通過認證、生物特征識別等技術解決申請人是否為本人的問題,關聯分析是利用圖關聯技術找出詐騙團夥;信用環節匯聚多個數據源,通過建模進行風險定價,金融科技服務商輸出信用評分給機構使用;貸後主要是排查異常客戶,及時報警,修復逾期客戶。
大數據在信貸流程中的應用
四、大數據風險控制的價值點分析
1.data
大數據風控中最重要的是什麽?
答案是:數據。
在數據的大數據風控核心中,沒有什麽比數據直接告訴金融機構某個目標客戶是黑名單客戶、嚴重逾期客戶更簡單高效的了。
最好是有海量數據,覆蓋足夠多的用戶;用戶數據價值密度高,噪音少,數據清理容易;用戶數據有多個維度,可以形成豐富的用戶畫像;自身的業務場景可以獲得有價值的數據。
2.技術
對於壹些金融機構來說,如果風控標準非常嚴格,查不進去的客戶其實不難,但是對於大多數金融機構來說,風控和業務是互斥的。為了提高業務量,既要降低準入標準,也要防範風險。這就需要技術手段,反欺詐建模和信用建模來評估白戶,評估客戶的信用水平來決定是否進入。
技術要求包括強大的底層技術架構能力、良好的企業級產品輸出能力和大數據清洗建模能力。未來需要結合Al等技術,形成智能風控反欺詐平臺。
場景
理財、保險、汽車金融、現金貸等金融服務。根據不同的場景對建模有不同的要求。建模能力要求對客戶的業務場景有很好的理解,模型能適合行業特點。需要有經驗的建模團隊和行業專家;服務行業標桿客戶,了解其業務場景;深刻理解業務需求。
動詞 (verb的縮寫)大數據風險控制在信貸中的應用
以白蓉系統為例,介紹授信流程中大數據風險控制的流程:
白蓉大數據風險控制申請貸款流程
目前的授信審批流程主要分為手工審批和自動審批。對於客戶資質好、信用好的客戶,只要能通過負面信息、欺詐信息、信用評價,系統都會自動審批。對於負面信息和欺詐風險未通過的客戶,系統可自動拒絕或申請人工審核。對於信用評分低的客戶,需要人工幹預。
六、常用大數據行業數據
央行征信報告:壹般持牌金融機構有權介入央行征信,包括個人執業資格記錄、行政獎懲記錄、法院訴訟及執行記錄、欠稅記錄等。司法信息:最高法及最新公布的省市法院名單,包括執行法院、立案時間、執行案號、執行對象、案件狀況、執行依據、執行機構、生效法律文書確定的義務、被執行人履行情況、失信被執行人行為等信息。公安信息:涵蓋涉案人員、在逃人員、在公安系統有犯罪記錄人員的信息,包括作案時間、案件細節等,如詐騙/制售假藥等。信用卡信息:銀行儲蓄卡/信用卡支出、收入、逾期等信息。出行信息:包括過去壹年每個季度的航班城市、航班時刻、座位級別等等數據。社交信息:包括社交賬號匹配類型、社交賬號性別、社交賬號粉絲數量等。運營商信息:查看運營商賬號的在線時間、在線狀態、消費等級等信息。網貸黑名單:根據個人姓名和身份證號,核實是否存在網貸逾期及黑名單信息。還有駕照狀態,租車黑名單,電商消費記錄等等。
七。大數據行業中的問題
目前整個大數據行業面臨的問題主要是客戶隱私泄露。公安、法院等信息,由於其信息的敏感性,實際上是遊走在法律監管的空白地帶。
在白航征信建立之前,各個數據機構的數據並沒有真正開放,數據的有效性會打折扣。預計白航征信的數據出來後,由於合並了各家銀行的數據,數據壹致性會更好。
大數據公司不同的數據采集和清洗方式會造成數據汙染,所以輸出的數據會不準確。
目前公民數據主要來源於線下采集和網絡行為記錄,數據存在壹定的滯後性,而僅線下采集的數據存在壹定的延遲性。
大數據還處於發展初期。目前很大的問題是數據量不夠大,不夠完整,如何協調數據開放和公民隱私的矛盾。未來需要結合人工智能、區塊鏈、物聯網等技術,實現數據篡改和數據及時采集的能力,從而更好地服務於金融。