文/新浪財(cái)經(jīng)金融e觀察(微信公眾號(hào):sinaeguancha)專欄作家 楊凱生
在大數(shù)據(jù)、互聯(lián)網(wǎng)時(shí)代,更需要注意處理好碎片化信息和完整性數(shù)據(jù)的關(guān)系,處理好結(jié)構(gòu)性數(shù)據(jù)和非結(jié)構(gòu)性數(shù)據(jù)的關(guān)系,還要處理好客戶個(gè)性化意識(shí)和社會(huì)化共同需求的關(guān)系等。
本文首發(fā)于5月23日出版的《財(cái)新周刊》。
一段時(shí)間來(lái),互聯(lián)網(wǎng)金融尤其是P2P網(wǎng)貸等出現(xiàn)了一些問(wèn)題。之所以發(fā)生這些問(wèn)題,原因是多方面的,除了常說(shuō)的法規(guī)不健全、監(jiān)管不夠有力、行業(yè)自律比較薄弱、投資者教育有所缺失等,很重要的一點(diǎn)是源于對(duì)互聯(lián)網(wǎng)、大數(shù)據(jù)技術(shù)的理解和認(rèn)識(shí)存在一定偏差。
人們常說(shuō)互聯(lián)網(wǎng)時(shí)代要有互聯(lián)網(wǎng)思維,進(jìn)而還將互聯(lián)網(wǎng)思維詮釋為共享、普惠、民主、開(kāi)放、高效、去中心化等。我們也總愿意把有關(guān)互聯(lián)網(wǎng)金融的一些概念,如P2P網(wǎng)貸、眾籌特別是比特幣、區(qū)塊鏈技術(shù)等,從哲學(xué)、社會(huì)學(xué)的意義上予以這樣的總結(jié)和升華。
這些說(shuō)法當(dāng)然有一定的道理,但我們似乎沒(méi)有更多注意到所謂互聯(lián)網(wǎng)思維應(yīng)有的另一層含義,那就是互聯(lián)網(wǎng)、大數(shù)據(jù)技術(shù)的發(fā)展和進(jìn)步,給人類提供的是從更寬視野、更多維度、更全方位來(lái)認(rèn)知問(wèn)題和分析問(wèn)題的工具和方法。這既是大數(shù)據(jù)時(shí)代、互聯(lián)網(wǎng)時(shí)代為社會(huì)進(jìn)步和經(jīng)濟(jì)發(fā)展創(chuàng)造的新條件,同時(shí)也是對(duì)我們自身提出的更高要求,賦予的更多約束。
也就是說(shuō),在大數(shù)據(jù)、互聯(lián)網(wǎng)時(shí)代,我們更需要注意處理好碎片化信息和完整性數(shù)據(jù)的關(guān)系,處理好結(jié)構(gòu)性數(shù)據(jù)和非結(jié)構(gòu)性數(shù)據(jù)的關(guān)系;作為企業(yè)包括銀行還要處理好客戶個(gè)性化意識(shí)和社會(huì)化共同需求的關(guān)系等等。在這些關(guān)系中,忽略了哪一方面都是不行的。
注重方法論
如果我們擁有了互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等一系列技術(shù)的進(jìn)步,但不能幫助我們防止思想上的片面性、避免形而上學(xué),而相反在認(rèn)識(shí)事物上更簡(jiǎn)單化、判斷問(wèn)題上更絕對(duì)化,那不僅可惜了這些時(shí)代文明進(jìn)步的產(chǎn)物,更重要的是還可能由于有了這些方面一定的技術(shù),反而更容易形成各種錯(cuò)判而導(dǎo)致失誤。
比如說(shuō),因?yàn)檎莆樟艘欢康目蛻粜畔?shù)據(jù),就以為是掌握了大數(shù)據(jù),而忽視了對(duì)數(shù)據(jù)分析工具和方法論的研究,這在金融業(yè)務(wù)中就很有可能影響對(duì)風(fēng)險(xiǎn)的識(shí)別、計(jì)量和防控,造成風(fēng)險(xiǎn)的積聚和擴(kuò)散。
這一階段,一些從事互聯(lián)網(wǎng)金融業(yè)務(wù)的公司、尤其是一些P2P網(wǎng)貸公司頻頻出現(xiàn)了失敗,除了一部分是蓄意欺詐行騙,多數(shù)正是因?yàn)樗麄儾](méi)有真正搞清楚究竟什么是大數(shù)據(jù),自己究竟獲得的是什么數(shù)據(jù),自己究竟有沒(méi)有掌握好所需要的數(shù)據(jù)挖掘技術(shù)、建模技術(shù)和分析評(píng)估技術(shù)。我們應(yīng)該認(rèn)識(shí)到,這些問(wèn)題并非只是技術(shù)問(wèn)題,在相當(dāng)程度上也是思想方法和認(rèn)識(shí)方法問(wèn)題。
例如,我們總以為自己擁有了某一方面不小的數(shù)據(jù)量,似乎就掌握了該領(lǐng)域的大數(shù)據(jù)。掌握的數(shù)據(jù)究竟是全量的、還只是可及的?大數(shù)據(jù)并非一定要求全量數(shù)據(jù),關(guān)鍵在于如果是可及數(shù)據(jù),那是全部可及的數(shù)據(jù)還是部分可及的?有無(wú)必要、有無(wú)能力得到全部可及數(shù)據(jù)?如果是部分可及數(shù)據(jù),那樣本范圍又是如何確定的,其確定的方式是否科學(xué)合理?這些問(wèn)題都需要扎扎實(shí)實(shí)下功夫才能解決。
現(xiàn)在可以看到,一些互聯(lián)網(wǎng)金融公司在宣傳中總要加上一句自己是如何運(yùn)用大數(shù)據(jù)技術(shù)的。其實(shí)他們所做的,大多是將自己客戶群的一些行為數(shù)據(jù)保留下來(lái)。暫不論這種收集和保留是否經(jīng)濟(jì)、合理,但把已得的數(shù)據(jù)當(dāng)作全量數(shù)據(jù)或是不加甄別地以為自己擁有的就是一個(gè)有充分代表性的樣本,那就一定會(huì)得出錯(cuò)誤的結(jié)論。
巴塞爾Ⅲ要求銀行業(yè)在觀察客戶違約概率和違約損失率時(shí),有關(guān)數(shù)據(jù)的積累長(zhǎng)度必須達(dá)到五年、七年乃至更長(zhǎng)時(shí)間,而且這中間還要有嚴(yán)格的數(shù)據(jù)清洗流程,就是為了盡量避免因數(shù)據(jù)缺陷而導(dǎo)致風(fēng)險(xiǎn)識(shí)別和計(jì)量上的失誤。前期出現(xiàn)的一些互聯(lián)網(wǎng)金融事件,除有的屬于人為惡意欺詐,也與這些公司在思想方法上存在片面性,過(guò)分高估自己能力且急功近利有關(guān)。他們對(duì)自己掌握的所謂大數(shù)據(jù)究竟能否用于、應(yīng)該如何用于風(fēng)險(xiǎn)識(shí)別和管控,并未經(jīng)過(guò)認(rèn)真的可行性研究,也沒(méi)有可靠的經(jīng)過(guò)反復(fù)驗(yàn)證的風(fēng)險(xiǎn)計(jì)量模型和科學(xué)有效的數(shù)據(jù)分析工具。
防止“過(guò)度擬合”
再如,也有人總是以為在一個(gè)樣本范圍內(nèi)得出了結(jié)論,就等同于掌握了對(duì)某個(gè)問(wèn)題全部的規(guī)律性認(rèn)識(shí)。其實(shí)在一個(gè)范圍內(nèi)的結(jié)論(即便是正確的結(jié)論)也不一定能夠簡(jiǎn)單外推,這就是在所謂機(jī)器學(xué)習(xí)中需要格外防止的模型“過(guò)度擬合”問(wèn)題。模型越是復(fù)雜、需要納入的變量越是多,就越容易出現(xiàn)這樣的問(wèn)題。這也正是在金融風(fēng)險(xiǎn)管控中必須注意的“模型風(fēng)險(xiǎn)”問(wèn)題。
通常來(lái)說(shuō),在經(jīng)濟(jì)生活中,在市場(chǎng)上,不同的企業(yè)、不同的客戶是存在個(gè)性化和差異化的,要對(duì)他們各自的違約風(fēng)險(xiǎn)以及違約損失作出判斷,僅靠模型的評(píng)估結(jié)論有時(shí)還是不夠的,必要時(shí)還需要有一定的“專家判斷”。這也就是我們一些銀行現(xiàn)在采用計(jì)算機(jī)進(jìn)行部分貸款審批時(shí),對(duì)高分段自動(dòng)進(jìn)入,低分段自動(dòng)拒絕,中間段加以必要的人工干預(yù)的原理。現(xiàn)在可以經(jīng)常看到,一些互聯(lián)網(wǎng)金融企業(yè)宣傳自己的所有貸款都可以在網(wǎng)上瞬間完成審批和發(fā)放,如真是那樣,對(duì)其風(fēng)險(xiǎn)把控的有效性是需要認(rèn)真審視和考量的。
不可輕視小數(shù)據(jù)
又如,有人以為有了數(shù)據(jù),就可以輕視對(duì)傳統(tǒng)小數(shù)據(jù)的開(kāi)發(fā)和利用。其實(shí),迄今并無(wú)關(guān)于大數(shù)據(jù)統(tǒng)一定義,大數(shù)據(jù)是相對(duì)于小數(shù)據(jù)而言的。大數(shù)據(jù)與小數(shù)據(jù)的主要區(qū)別不是數(shù)據(jù)量的大小(盡管數(shù)據(jù)量過(guò)小無(wú)法稱之為大數(shù)據(jù)),大數(shù)據(jù)的重要特征在于它應(yīng)該既包括結(jié)構(gòu)性數(shù)據(jù),也包括那些在生成時(shí)表現(xiàn)為非結(jié)構(gòu)性特征的信息;而小數(shù)據(jù)主要指二維的結(jié)構(gòu)性數(shù)據(jù)。大數(shù)據(jù)有大數(shù)據(jù)的長(zhǎng)處,亦有不足;小數(shù)據(jù)有小數(shù)據(jù)的欠缺,但也有不可忽略的優(yōu)勢(shì)和必須用它的理由。
比如說(shuō),傳統(tǒng)的小數(shù)據(jù)有經(jīng)典的數(shù)理模型,有比較成熟的數(shù)據(jù)分析統(tǒng)計(jì)理論、方法,方法論是已經(jīng)解決了的,數(shù)據(jù)挖掘的技術(shù)早就成形了。但到今天為止,大數(shù)據(jù)的管理理論、分析方法都還處在快速發(fā)展更迭的階段,并未十分成形。而且,還有一部分非結(jié)構(gòu)性數(shù)據(jù)在分析使用時(shí),也需要通過(guò)技術(shù)手段轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù)才能實(shí)現(xiàn)。
另一點(diǎn)就是必須看到大數(shù)據(jù)數(shù)量越大,噪音相應(yīng)就越大,甚至往往在數(shù)據(jù)大幅增加時(shí),噪音的增幅要快于數(shù)據(jù)量的增幅。因而大數(shù)據(jù)的挖掘成本是比較高的。再比如,大數(shù)據(jù)更易反映出一些相關(guān)關(guān)系,而小數(shù)據(jù)通過(guò)分析比較容易直接得出因果關(guān)系。在許多情況下,相關(guān)關(guān)系不能簡(jiǎn)單地取代因果關(guān)系。
小數(shù)據(jù)抽取現(xiàn)實(shí)世界一些事情最核心的內(nèi)容,與大數(shù)據(jù)相比,它具有單位信息容量更大的特點(diǎn)。比如銀行的一些業(yè)務(wù)數(shù)據(jù),我們通常可以把它定義為小數(shù)據(jù)、結(jié)構(gòu)化數(shù)據(jù)。它直接反映了客戶和銀行交易活動(dòng)的最終結(jié)果。但是客戶之所以進(jìn)行這個(gè)交易的行為路徑,特別是他之所以要進(jìn)行這個(gè)交易的決策過(guò)程,是傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)、小數(shù)據(jù)所難以反映的;而客戶的一些社交行為數(shù)據(jù)就有可能反映他的決策過(guò)程。這就是大數(shù)據(jù)的一個(gè)優(yōu)勢(shì)。
盡管銀行和客戶發(fā)生了交易這一事情是最實(shí)質(zhì)的,是銀行最需要掌握和記錄的,但是如果能了解客戶的決策過(guò)程,了解他的這個(gè)行為路徑,這無(wú)疑對(duì)提升服務(wù)水準(zhǔn)和防范風(fēng)險(xiǎn)都是有意義的。
因此,大數(shù)據(jù)和小數(shù)據(jù)各有特點(diǎn),各有長(zhǎng)處、短處。簡(jiǎn)單地想以此來(lái)取代彼,不是一種科學(xué)的看法。只有把小數(shù)據(jù)分析方法的完備性、準(zhǔn)確性和大數(shù)據(jù)的多維性、即時(shí)性融合起來(lái),才能對(duì)管理真正帶來(lái)一種質(zhì)的改變。應(yīng)該說(shuō),前一階段一些互聯(lián)網(wǎng)金融企業(yè)出現(xiàn)的問(wèn)題,就與這方面思想認(rèn)識(shí)上的片面性有關(guān)。
總之,在對(duì)互聯(lián)網(wǎng)金融進(jìn)行集中整治的過(guò)程中,除了就事論事,更重要的還需從認(rèn)識(shí)論、方法論的角度來(lái)進(jìn)行總結(jié)和提高。數(shù)據(jù)是一種財(cái)富,因?yàn)樗侨祟惢顒?dòng)的記錄與結(jié)晶。但數(shù)據(jù)多了有時(shí)也會(huì)帶來(lái)挑戰(zhàn),記錄中可能摻雜噪音,結(jié)晶旁也許陷阱縱橫。
對(duì)于數(shù)據(jù)信息的不當(dāng)理解,對(duì)于分析方法的盲目應(yīng)用,以及數(shù)據(jù)使用者本身的目的、品性如果存在問(wèn)題,那就有可能使得人們?cè)诿鎸?duì)世間萬(wàn)象時(shí),變得比以往缺乏數(shù)據(jù)信息的年代更加迷惑。
作為互聯(lián)網(wǎng)時(shí)代一個(gè)合格的現(xiàn)代人,只有學(xué)會(huì)客觀地看待數(shù)據(jù),合理地選擇工具,科學(xué)地進(jìn)行分析,才能夠從紛繁復(fù)雜的社會(huì)經(jīng)濟(jì)生活中提煉出那些有價(jià)值的結(jié)論。也只有那樣,才能夠說(shuō)我們具有了真正的大數(shù)據(jù)思維、互聯(lián)網(wǎng)思維;也只有那樣,互聯(lián)網(wǎng)金融才能夠走出一條更健康、更有序的發(fā)展之路。
(本文作者介紹:工商銀行原行長(zhǎng)、銀監(jiān)會(huì)特邀顧問(wèn))
責(zé)任編輯:鄒楓 SF168
歡迎關(guān)注官方微信“意見(jiàn)領(lǐng)袖”,閱讀更多精彩文章。點(diǎn)擊微信界面右上角的+號(hào),選擇“添加朋友”,輸入意見(jiàn)領(lǐng)袖的微信號(hào)“kopleader”即可,也可以掃描下方二維碼添加關(guān)注。意見(jiàn)領(lǐng)袖將為您提供財(cái)經(jīng)專業(yè)領(lǐng)域的專業(yè)分析。