消費信貸規(guī)模的擴張,又與智能風控的發(fā)展息息相關。但由于風控技術重實操,各家所運用的技術又不盡相同,因此相關的匯總類研究較為匱乏。
本文試圖從消費信貸業(yè)智能風控的發(fā)展近況切入,重點解析信用評分產品在智能風控貸前管理中的應用,并揭示作為雙刃劍的智能風控所具有的若干缺陷。
一、智能風控的興起與發(fā)展
科學技術的發(fā)展日新月異,智能技術在金融領域正實現持續(xù)性的滲透。近年來,智能技術先后在營銷、風控、審計、投顧、投研等領域得到運用,如下圖所示:
其中,在消費信貸領域實現廣泛運用的有智能營銷及智能風控。智能風控,是指在傳統風控上融入智能因素,結合大數據、人工智能、區(qū)塊鏈等新型技術,對信貸申請進行風險控制的一項技術。智能風控這一概念在我國普及的時間并不長,2017年后才逐漸熱門起來。
二、個體定位——身份識別與反欺詐
信貸機構與借款用戶接觸的第一步,是對其的個體定位,具體如下:
1. 身份識別
身份識別是判斷借款人身份的首要步驟,一般以用戶證照信息為基礎,所使用到的技術主要有生物識別以及OCR技術。
生物識別,是將計算機與光學、聲學、生物傳感器和生物統計學原理等高科技手段相結合,利用身體特征來鑒別個人身份的技術。其中較為成熟的是指紋及人臉識別技術。消費信貸領域中,指紋認證通常被用于手機APP登錄驗證等,而人臉識別技術則更為普及,近年來廣泛代替了傳統手持身份證照片的驗證方式,例如刷臉認證在借款用戶申請階段廣為運用。
OCR技術(Optical Character Recognition),全稱光學字符識別技術,其原理是利用掃描等光學錄入方式將各類證件、資料、印刷品上的文字轉化為圖像信息,再通過文字識別技術將其轉化成計算機輸入技術。
身份證識別和銀行卡綁定是OCR技術在消費信貸中運用最廣的兩項。一方面,通過OCR提取身份證頭像,能夠取得快速獲取身份識別的目標,達到人證合一;另一方面,OCR能夠快速識別銀行卡號、持卡人、發(fā)卡行等關鍵欄位并自動填入識別到的信息內容,不僅在信貸平臺,在電商平臺的交易支付中亦得到大量使用。
2. 用戶畫像
身份識別是對申請用戶的基本信息進行了底層描繪,而用戶畫像則進一步通過用戶授權,查詢其央行征信、第三方征信、網絡交易行為等多重維度。
征信信息是判斷借款人信用最為直接,也最為高效的途徑。從數據來看,截至到今年6月,央行征信系統累計收錄9.9億自然人,個人日均查詢量達550萬次。近兩年民營征信巨頭——百行征信亦在消費信貸的運用中發(fā)揮了較大作用。除此之外,還有其他第三方征信信息、共享征信系統等在信貸審批機構的用戶畫像、共債風險識別等方面提供了助力。
公共繳費、網絡消費、運營商數據等需獲取用戶授權,從消費頻率、金額等維度對用戶進行判斷,結合后續(xù)借款人評分步驟賦予其評分與授信。此外還包含其他信息,例如使用設備(ID、設備型號等)、戶口認證、學歷認證等。
3. 反欺詐模型構建
互聯網金融蓬勃發(fā)展的同時,消費信貸領域因欺詐所致的壞賬問題也日益凸顯。公開數據顯示,截至2018年,網絡黑產導致的信息泄漏預估在幾十億條級別,涉及欺詐團伙超3萬個。
消費信貸領域的騙貸已成為非法黑產中不容忽視的重災區(qū),甚至存在專業(yè)化的組織以團體形式“擼貸”、“擼口子”。因此,建立以反欺詐為核心的防火墻已刻不容緩。
根據工作原理,反欺詐模型可分為“基于規(guī)則的反欺詐模型” (Rule Based system)和“基于客戶行為(Behavior Based system)的反欺詐模型”。
從核心架構來看,基于規(guī)則的反欺詐模型主要是建立規(guī)則庫,其規(guī)則內容包括客戶基本屬性、賬戶基本屬性等。而基于用戶行為的反欺詐模型則需要根據過往用戶數據的收集建立起用戶行為庫,因此其劣勢也顯而易見:對用戶數據的規(guī)模、積累時間均有一定要求。
實務中,一些企業(yè)將兩類模型充分結合,通過設定規(guī)則庫對可疑用戶進行識別,再通過收集到的用戶行為不斷對規(guī)則庫進行更新,同時融入專家經驗對模型修正。目前,消費信貸領域就反欺詐模型構建所涉研究方法包括但不僅限于神經網絡、決策樹、機器學習、隨機森林等。
以某赴美上市的金融科技企業(yè)為例,其已積累了千萬級別的黑名單和數億白名單庫,運行系統內擁有超過兩百個風控子模型,且具備實時自動更新模型的能力,部分風險模型的迭代時間以周為頻次。
三、資質衡量——信用評分與風險定價
在完成身份識別、用戶畫像及反欺詐工作后,合格用戶會進入到信用評分及授信環(huán)節(jié),流程圖如下所示:
1. 信用評分
我國信用評分業(yè)務的開展最早可以追溯到上世紀八十年代。根據模型建立來源,信貸領域的評分方式可劃分為三類:獨立建模、聯合建模和完全外包。
一般而言,自身業(yè)務規(guī)模較大、團隊架構較為完善的信貸機構會進行獨立建模,例如某些銀行、大型P2P機構等;聯合建模則加入了部分大數據風控公司,與業(yè)務公司共同合作、聯合開發(fā);完全外包的機構則是由于自身條件有限而尋求外部助力。在監(jiān)管強調持牌金融機構不得將核心風控環(huán)節(jié)外包的大環(huán)境下,此類評分方式存在的空間正被大幅度壓縮。
2. 風險定價
前述環(huán)節(jié)均是為最終的風險定價、授信放款作鋪墊。各風控環(huán)節(jié)剔除掉的借款用戶比例如何?
在該互金機構的反欺詐環(huán)節(jié)中,有80%的用戶被拒;90%進入到定價環(huán)節(jié),進而產生A、B、C、D四個不同等級并被給予對應授信額度。不同等級會對借款費率產生何種影響?如下表列示:
四、智能風控面臨的風險及對策
盡管近年來智能風控技術得到了大力發(fā)展,但作為一把雙刃劍,智能風控同樣存在部分缺陷,具體如下:
1. 用戶授權與隱私信息管理
消費信貸的智能風控是基于大數據作出的決策,在底層數據的獲取來源方面存在爭議。某些信貸APP繞過用戶授權,直接抓取甚至監(jiān)控用戶個人數據,例如今年315晚會所曝光的“探針盒子”,以及京東金融因留存用戶手機截圖被點名等。APP專項治理工作組多次公示點名了在個人信息保護方面工作不力的主體機構,理財、信貸類APP成為重災區(qū)。
2. “信用分”孤島
2013年,業(yè)內曾有兩位學者通過對美國Lending Club 平臺底層數據的研究,將 FICO與違約率進行回歸,得到 FICO 評分與違約率具有強正相關關系的結論,并指出國內信貸行業(yè)應當建立一個全國范圍的信用評估體系。
但國內目前正缺乏這樣一種體系,一些“信用分”對歷史信用還款記錄過于倚重,甚至導致一個每月負債、以貸還貸“老哥”的信用額度高于一個正常消費的辦公白領。此外,一些電商平臺過于倚重自身生態(tài)圈的消費記錄,其信用分的累計規(guī)則尚未與其他機構進行打通,仍處于孤島狀態(tài)?! ?/p>