大數(shù)據(jù)風(fēng)控的現(xiàn)狀、問題及優(yōu)化路徑
作者:巴曙松
摘要:在互聯(lián)網(wǎng)技術(shù)和信息技術(shù)的推動下,大數(shù)據(jù)在金融行業(yè)的風(fēng)控中獲得了引人注目的進展,但是在實際運用中其有效性還需進一步提高。當(dāng)前大數(shù)據(jù)風(fēng)控有效性不足既有數(shù)據(jù)質(zhì)量的障礙,也有大數(shù)據(jù)風(fēng)控的理論性障礙,還有數(shù)據(jù)保護的制度障礙。消除這些障礙、提高大數(shù)據(jù)風(fēng)控的有效性,需要金融企業(yè)、金融研究部門和政府監(jiān)管部門的共同努力。
關(guān)鍵詞:互聯(lián)網(wǎng)金融;大數(shù)據(jù);風(fēng)險控制
大數(shù)據(jù)已經(jīng)撼動了世界的方方面面,從商業(yè)科技到醫(yī)療、政府、教育、經(jīng)濟、人文以及社會其他各個領(lǐng)域。早在1980年,阿爾文堢夫勒(Alvin Toffler,1980)在《第三次浪潮》一書中就預(yù)言大數(shù)據(jù)將成“第三次浪潮”。奧巴馬政府將大數(shù)據(jù)定義為“未來的新石油”。凱文凱利(Kevin Kelly,2014)認(rèn)為所有的生意都是數(shù)據(jù)生意。2013年互聯(lián)網(wǎng)金融將“大數(shù)據(jù)”推向了新的高度。金融的核心是風(fēng)險控制,將風(fēng)控與大數(shù)據(jù)結(jié)合、不斷完善和優(yōu)化風(fēng)控制度和體系,對于互聯(lián)網(wǎng)金融企業(yè)和傳統(tǒng)金融企業(yè)而言都同等重要。
一。大數(shù)據(jù)風(fēng)控發(fā)展迅速,但有效性不佳
在應(yīng)用層面,金融行業(yè)利用大數(shù)據(jù)進行風(fēng)控已經(jīng)取得了一定的成效。使用大數(shù)據(jù)進行風(fēng)控已成為美國等發(fā)達國家互聯(lián)網(wǎng)金融企業(yè)的標(biāo)準(zhǔn)配置。
美國Zest Finance公司開發(fā)的10個基于學(xué)習(xí)機器的分析模型,對每位信貸申請人的超過1萬條原始信息數(shù)據(jù)進行分析,并得出超過7萬個可對其行為做出測量的指標(biāo),而這一過程在5秒鐘內(nèi)就能全部完成。
為網(wǎng)上商家提供金融信貸服務(wù)的公司Kabbage主要目標(biāo)客戶是ebay、Amazon、PayPal等電商,其通過獲取這些企業(yè)網(wǎng)店店主的銷售、信用記錄、顧客流量、評論、商品價格和存貨等信息,以及他們在Facebook和Twitter上與客戶的互動信息,借助數(shù)據(jù)挖掘技術(shù),把這些店主分成不同的風(fēng)險等級,以此來確定提供貸款金額數(shù)量與貸款利率水平。
中國互聯(lián)網(wǎng)金融企業(yè)對于大數(shù)據(jù)風(fēng)控的運用也如火如荼。
阿里推出了面向社會的信用服務(wù)體系芝麻信用,芝麻信用通過分析大量的網(wǎng)絡(luò)交易及行為數(shù)據(jù),對用戶進行信用評估,這些信用評估可以幫助互聯(lián)網(wǎng)金融企業(yè)對用戶的還款意愿及還款能力做出結(jié)論,繼而為用戶提供相關(guān)的金融和經(jīng)濟服務(wù)。
騰訊的微眾銀行推出的“微粒貸”產(chǎn)品,其風(fēng)控核心就是,通過社交大數(shù)據(jù)與央行征信等傳統(tǒng)銀行信用數(shù)據(jù)結(jié)合,運用社交圈、行為特征、交易、基本社會特征、人行征信5個維度對客戶綜合評級,運用大量的指標(biāo)構(gòu)建多重模型,以快速識別客戶的信用風(fēng)險。
對于大數(shù)據(jù)風(fēng)控的理論研究尚處于萌芽階段,本文以“大數(shù)據(jù)風(fēng)控”為主題在CNKI數(shù)據(jù)庫進行搜索,與此相關(guān)的文獻數(shù)量可以從側(cè)面反映大數(shù)據(jù)風(fēng)控的理論研究現(xiàn)狀。
CNKI數(shù)據(jù)庫中以“大數(shù)據(jù)風(fēng)控”為主題的文獻共46篇。在這些文獻中,以報道性的文章較多,重要報紙全文庫和特色期刊總共為33篇,占比72%;而理論研究的文章較少,中國學(xué)術(shù)期刊總庫為12篇,占比26%;尚沒有CSSCI2014—2015年的來源期刊(如圖1)。
圖1 CNKI數(shù)據(jù)庫與大數(shù)據(jù)相關(guān)的文獻數(shù)量和分類
雖然大數(shù)據(jù)風(fēng)控在實踐上已經(jīng)有所進展,但是其有效性也受到一些挑戰(zhàn)。
例如,以大數(shù)據(jù)風(fēng)控為基石的P2P平臺就頻頻暴露出各種各樣的問題來。對于P2P平臺來說,由于其純線上操作的特點,大數(shù)據(jù)風(fēng)控的有效性是決定其經(jīng)營狀況的重要因素,如果大數(shù)據(jù)風(fēng)控有效性較差,則面臨的壞賬壓力較大,容易出現(xiàn)提現(xiàn)困難甚至跑路的問題。
網(wǎng)貸之家的數(shù)據(jù)顯示,2015年上半年新增問題平臺419家,是2014年同期的7。5倍,已超過2014年全年問題平臺數(shù)量。截至2015年10月底,全國問題平臺數(shù)累積已達1115家。
二。當(dāng)前大數(shù)據(jù)風(fēng)控有效性不足的原因分析
一些學(xué)者對于大數(shù)據(jù)風(fēng)控的有效性問題進行了研究。
王強(2015)指出當(dāng)前個人大數(shù)據(jù)征信的問題,一是數(shù)據(jù)的真實性,二是數(shù)據(jù)收集的法律障礙,三是壞賬的不可預(yù)測性問題。
甚至有作者認(rèn)為大數(shù)據(jù)風(fēng)控是無效的,陳宇(2015)援引各種證據(jù)認(rèn)為大數(shù)據(jù)風(fēng)控是無效的。
總體而言,當(dāng)前大數(shù)據(jù)風(fēng)控有效性欠佳的原因主要有以下幾個方面:
(一)數(shù)據(jù)的質(zhì)量問題
當(dāng)前大數(shù)據(jù)風(fēng)控的有效性欠佳,其首要原因就是數(shù)據(jù)的真實性不高,包括社交數(shù)據(jù)和交易數(shù)據(jù)兩個方面。
1。社交數(shù)據(jù)的真實性問題
美國lending club和facebook合作獲取社交數(shù)據(jù),在中國宜信也曾大費周折的收集借款人的社交數(shù)據(jù),最后兩者得出的結(jié)論都是社交數(shù)據(jù)根本就不能用。美國很多大數(shù)據(jù)征信公司的信息錯誤率高達50%,垃圾進、垃圾出。
2。交易數(shù)據(jù)的真實性問題。
當(dāng)前許多電商平臺的刷單現(xiàn)象非常嚴(yán)重,這將導(dǎo)致交易數(shù)據(jù)的嚴(yán)重失真。隨著網(wǎng)購的火爆,有關(guān)電商平臺“刷單”的報道屢見報端。
電商“刷單”有兩種方式,一種是商家找所謂的消費者進行“刷單”。賣家買快遞單號,其收件人和寄件人與實際的買家、賣家不一致。
另一種是快遞公司發(fā)空包,但快遞公司并未完成配送,而幫助商家完成平臺上的物流信息。
(二)大數(shù)據(jù)風(fēng)控的理論有效性問題
從IT技術(shù)層面論證大數(shù)據(jù)風(fēng)控的實踐性案例已經(jīng)很多,但是在經(jīng)濟金融的理論層面,大數(shù)據(jù)風(fēng)控還面臨一些問題需要解決。
1。金融信用與社會信用的相關(guān)性不確定
目前大數(shù)據(jù)主要來源于互聯(lián)網(wǎng),而人們在網(wǎng)絡(luò)中的表現(xiàn)并不能完全反映其真實的一面。相同的人群在不同場合呈現(xiàn)的特征是不一樣的,尤其是目前人們在線上、線下割裂的狀態(tài),其行為方式往往會出現(xiàn)強烈的反差。
例如有些人不善交際,卻將自己做的美食展示在微博上,吸引大量關(guān)注,粉絲暴增。因此網(wǎng)絡(luò)并不能確切地證明某人的社交圈子,也就是說互聯(lián)網(wǎng)的數(shù)據(jù)很難還原用戶現(xiàn)實中的信息。
2。大數(shù)據(jù)對于“黑天鵝”事件的滯后性
在現(xiàn)實世界,總會出現(xiàn)不可預(yù)測的“黑天鵝”事件,一旦出現(xiàn)則有可能沖擊大數(shù)據(jù)風(fēng)控模型的基本假設(shè),進而影響大數(shù)據(jù)風(fēng)控的有效性。大到美國的次貸危機,小到個人意外事件的發(fā)生,在某種程度上大數(shù)據(jù)風(fēng)控是無法預(yù)測的,但這些事件的發(fā)生,對宏觀經(jīng)濟和微觀主體都會產(chǎn)生重大的影響。
例如,2008年美國次貸危機后產(chǎn)生了一種“策略性違約”行為——貸款主體本身有能力還款,但是其在房價遠(yuǎn)低于貸款總額的時候,重新購買一套房子,并對之前的房貸斷供,貸款者可以此方法進行“套利”。
雖然此類違約者會因此有不良信用記錄,但是這對信用報告的影響有限,因為其他的債務(wù)按期償還。而大數(shù)據(jù)對這種突變事件的預(yù)測能力則非常有限。
(三)大數(shù)據(jù)收集和使用的制度問題
在數(shù)據(jù)收集和使用的過程中也面臨著合法使用的問題。如何高效、適度地開發(fā)和使用大數(shù)據(jù),不僅僅是一個技術(shù)問題,也是一個社會問題,這些泄露的數(shù)據(jù)大量流入數(shù)據(jù)黑市,造成了用戶安全、企業(yè)安全甚至國家安全方面的連鎖反應(yīng)。數(shù)據(jù)的收集和使用在很多時候都沒有征得數(shù)據(jù)生產(chǎn)主體的同意,這導(dǎo)致了數(shù)據(jù)的濫用和隱私的泄露。
近年來,個人數(shù)據(jù)泄露事件頻頻發(fā)生,因個人數(shù)據(jù)泄露而造成損失的新聞屢見報端。獵豹移動安全實驗室發(fā)布的《2015年上半年移動安全報告》顯示,截至2015年上半年,獵豹共監(jiān)測到496起數(shù)據(jù)泄露事件,影響超過544萬人。2015年10月19日,烏云網(wǎng)發(fā)布消息稱,網(wǎng)易的用戶數(shù)據(jù)庫疑似泄露。
圖2 2005-2014年國內(nèi)外數(shù)據(jù)泄密情況資料來源:上海漢均信息技術(shù)有限公司《2005—2014年全球泄密事件分析報告》
數(shù)據(jù)安全問題也將越來越多的企業(yè)推向風(fēng)口浪尖。
上海漢均信息技術(shù)有限公司發(fā)布的《2005—2014年全球泄密事件分析報告》顯示,10年間,全球泄密事件中,我國泄密事件數(shù)量占比為58。5%,其中高頻發(fā)地域主要是東部沿海經(jīng)濟較發(fā)達、產(chǎn)業(yè)格局以高技術(shù)含量為主的一二線城市(如圖2)。
Verizon發(fā)布《2015年數(shù)據(jù)泄露調(diào)查報告》,報告覆蓋95個國家,其中有61個報告了問題,涉及79790個安全事件(Security Incident),超過2000個(2122個)確認(rèn)數(shù)據(jù)泄露(Data Breach)。
三。提高大數(shù)據(jù)風(fēng)控有效性的路徑
盡管大數(shù)據(jù)風(fēng)控的有效運用尚處在諸多障礙,但這并不能成為大數(shù)據(jù)風(fēng)控?zé)o效的理由。因為對于數(shù)據(jù)這個資源的挖掘尚處于初級階段,在消除障礙、解決問題中前行,是大數(shù)據(jù)風(fēng)控發(fā)展的必然趨勢。有效掃除當(dāng)前大數(shù)據(jù)風(fēng)控的障礙需要各方面的共同努力,其中金融企業(yè)、金融研究部門和政府監(jiān)管部門的角色尤為重要。
對于金融企業(yè)而言,要從基礎(chǔ)數(shù)據(jù)上保證客戶數(shù)據(jù)的多樣化、連續(xù)性和實時性,確保數(shù)據(jù)真實可靠。
對于金融研究者而言,可從經(jīng)濟學(xué)、數(shù)學(xué)等多個角度綜合論證大數(shù)據(jù)風(fēng)控的有效性,為大數(shù)據(jù)風(fēng)控提供理論支持。
對于政府監(jiān)管部門而言,需要從法律制度、會計制度等方面進行建設(shè),構(gòu)建數(shù)據(jù)合理運用的良好環(huán)境體系。
(一)對于金融企業(yè)而言,要構(gòu)建多樣化、連續(xù)性和實時性的基礎(chǔ)數(shù)據(jù)
1。多維度的收集數(shù)據(jù),互聯(lián)互通,打破數(shù)據(jù)的孤島
美國征信系統(tǒng)的完善是因為美國政府對其擁有的大數(shù)據(jù)資源的開放程度日益透明化。
目前我國的大數(shù)據(jù)風(fēng)控系統(tǒng)還沒有實現(xiàn)互通互聯(lián),阿里、銀聯(lián)、平安、騰訊以及眾多的P2P公司,都是各自為政,P2P公司拿不到央行的數(shù)據(jù),幾家大的互聯(lián)網(wǎng)平臺在相關(guān)大數(shù)據(jù)的分享上彼此也未互通有無。
因而,各金融企業(yè)要建立互聯(lián)互通機制,打破數(shù)據(jù)孤島,從而能多維度地收集數(shù)據(jù),確保數(shù)據(jù)之間能夠相互驗證。
2。從供應(yīng)鏈交易環(huán)節(jié)獲取數(shù)據(jù)
獲取真實數(shù)據(jù)最好的途徑就是要切入客戶的交易環(huán)節(jié),尤其是穩(wěn)定可持續(xù)的交易環(huán)節(jié),即供應(yīng)鏈。
一方面,經(jīng)過了幾十年的發(fā)展,當(dāng)前的供應(yīng)鏈都有一套完整上下游進入和退出機制,數(shù)據(jù)的真實性對于核心企業(yè)而言至關(guān)重要,因而這些數(shù)據(jù)的質(zhì)量非常優(yōu)異。
另一方面,這些數(shù)據(jù)和數(shù)據(jù)維度對于供應(yīng)鏈中的企業(yè)評價是可靠的,金融企業(yè)可以此為基礎(chǔ),加上自身的風(fēng)險控制經(jīng)驗,構(gòu)建一套全新的基于數(shù)據(jù)的信用評價機制。
3。積極布局“物聯(lián)網(wǎng)+”
物聯(lián)網(wǎng)覆蓋了產(chǎn)品生產(chǎn)、交易和使用的環(huán)節(jié),因而互聯(lián)網(wǎng)只是物聯(lián)網(wǎng)的一部分。在物聯(lián)網(wǎng)下,不僅要獲取交易環(huán)節(jié)的數(shù)據(jù),更重要的是獲取生產(chǎn)環(huán)節(jié)和使用環(huán)節(jié)的數(shù)據(jù)。
因而,金融企業(yè)要積極布局“物聯(lián)網(wǎng)+”,為獲取更為全面的數(shù)據(jù)打下基礎(chǔ)。例如,企業(yè)機器運行數(shù)據(jù),可以收集客戶汽車駕駛數(shù)據(jù),可穿戴設(shè)備的身體狀況數(shù)據(jù),等等。這些數(shù)據(jù)都是大數(shù)據(jù)風(fēng)控不可或缺的部分。
(二)對于金融研究部門而言,可從經(jīng)濟、金融等多個角度綜合論證大數(shù)據(jù)風(fēng)控的有效性,為大數(shù)據(jù)風(fēng)控提供理論支持
當(dāng)前對于大數(shù)據(jù)風(fēng)控模型的構(gòu)建大多是從技術(shù)的角度探討的。但是,從經(jīng)濟、金融角度進行的探討亟待加強,不同的經(jīng)濟假設(shè)會使模型推導(dǎo)的結(jié)果產(chǎn)生截然不同的變化。因而,從經(jīng)濟、金融等角度對大數(shù)據(jù)風(fēng)控有效性的研究就顯得很有必要了。比如大數(shù)據(jù)風(fēng)控如何順應(yīng)經(jīng)濟周期的變化,如何從統(tǒng)計上論證過去的數(shù)據(jù)對于未來行為判斷的準(zhǔn)確性,如何解決道德風(fēng)險所帶來的不確定性。例如,唐時達(2015)提出要把數(shù)據(jù)提升至與傳統(tǒng)抵質(zhì)押品同等重要的高度,建立“數(shù)據(jù)質(zhì)押”風(fēng)控體系。
(三)對于政府監(jiān)管部門而言,要推動和完善與數(shù)據(jù)相關(guān)的制度建
1。法律制度的建設(shè),對數(shù)據(jù)的收集和使用予以法律上的保護
我國對于數(shù)據(jù)保護的制度性舉措散見于多部法律中,如憲法、刑法、侵權(quán)責(zé)任法等,多是以保護個人隱私、通信秘密等形式出現(xiàn),尚缺乏一部數(shù)據(jù)保護的專門性法律。這導(dǎo)致了數(shù)據(jù)的法律邊界不明,數(shù)據(jù)保護法律的操作性不強、數(shù)據(jù)保護執(zhí)法機制滯后等問題,制約了數(shù)據(jù)收集和運用的發(fā)展。
對此,最理想的狀況是出臺一部《信息保護法》。在完善個人信息保護法律制度的道路上,應(yīng)出臺《個人信息保護法》,明確國家機關(guān)、商家和其他法人、自然人掌握個人信息的邊界和使用的范圍[6-7]。齊愛民、盤佳(2015)認(rèn)為要構(gòu)建數(shù)據(jù)主權(quán)和數(shù)據(jù)權(quán)法律制度[8]。2014年最高人民法院頒布的《關(guān)于審理侵害信息網(wǎng)絡(luò)傳播權(quán)民事糾紛案適用法律若干問題的規(guī)定》(以下簡稱《規(guī)定》)就是此領(lǐng)域的進展之一,《規(guī)定》首次明確了個人信息保護的范圍。
2。會計制度建設(shè),對數(shù)據(jù)資產(chǎn)予以明確的計量
隨著數(shù)據(jù)重要性的提升,數(shù)據(jù)列入企業(yè)資產(chǎn)負(fù)債表只是時間問題,數(shù)據(jù)將和土地、勞動力和資本一樣,成為一種生產(chǎn)要素(Viktor Mayer-Sch?nberger,2013)。越來越多的理論界和實務(wù)界的研究者都傾向于認(rèn)為數(shù)據(jù)將成為個體的財產(chǎn)和資產(chǎn)。
2012年達沃斯世界經(jīng)濟論壇發(fā)布的《大數(shù)據(jù),大影響》報告認(rèn)為,數(shù)據(jù)已經(jīng)成為一種新的經(jīng)濟資產(chǎn)類別。
姜建清在2014達沃斯世界經(jīng)濟論壇上發(fā)表觀點,其認(rèn)為個體的數(shù)據(jù)其實就是個體財產(chǎn)的一部分,沒有經(jīng)過本人同意不應(yīng)該被濫用。
因此,需要建立相應(yīng)的會計制度對于數(shù)據(jù)價值進行科學(xué)有效的評估。有學(xué)者對此進行了初步研究。例如,劉玉(2014)從會計的角度對數(shù)據(jù)的資產(chǎn)可行性進行了分析,探討了數(shù)據(jù)資產(chǎn)的計量方法,研究了大數(shù)據(jù)資產(chǎn)的折舊、披露等問題。
參考文獻:
[1]王強“。垃圾進垃圾出”:大數(shù)據(jù)征信的難題[EB/OL]。財新網(wǎng),2015-04-23。
[2]陳宇。風(fēng)吹江南之互聯(lián)網(wǎng)金融[M]。上海:東方出版中心,2014,(6):234-240。
[3]梁宵。企業(yè)數(shù)據(jù)安全“烏云”密布:難以估量的“未來”危機[N]。中國經(jīng)營報,2015-11-01(6)。
[4]本報記者朱劍紅。打破信用信息“孤島”(政策解讀)[N]。人民日報,2015-06-26(2)。
[5]唐時達,李智華,李曉宏。供應(yīng)鏈金融新趨勢[J]。中國金融,2015,(10):40-41。
[6]葉文輝。大數(shù)據(jù)征信機構(gòu)的運作模式及監(jiān)管對策——以阿里巴巴芝麻信用為例[J]。國際金融,2015,(8):18-22。
[7]本報見習(xí)記者韓天琪。個人信息保護圈如何劃[N]。中國科學(xué)報,2014-11-02(5)。
[8]齊愛民,盤佳。數(shù)據(jù)權(quán)、數(shù)據(jù)主權(quán)的確立與大數(shù)據(jù)保護的基本原則[J]。蘇州大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2015,(1):64-70。
[9]劉玉。淺論大數(shù)據(jù)資產(chǎn)的確認(rèn)與計量[J]。商業(yè)會計,2014,(18):3-4。
。ㄍ辏
文章來源:《金融理論與實踐》 2016年02期(本文僅代表作者觀點)
文章熱詞: 大數(shù)據(jù)管理專題; ·大數(shù)據(jù)管理 ·互聯(lián)網(wǎng)金融 ·大數(shù)據(jù)風(fēng)險控制作者:巴曙松;上傳用戶:minghao;上傳時間:2016-4-8;來源:價值中國