文/新浪財經意見領袖專欄作家 洪偌馨
人類這種生物體正在孕育巨大的非生物體來逐步接管自己的命運,但誰都不愿成為數據的‘試驗品’和‘犧牲者’。
大數據、人工智能為我們勾畫了未來宏偉藍圖的同時,卻從鮮少向人們顯示與‘便捷’孿生的‘危險’底色,直到有人將現實撕開一道口子。
最近,江蘇淮安警方依法打擊了7家涉嫌侵犯公民個人信息犯罪的公司。其中,2015年3月以來,北京考拉征信公司非法提供查詢返照9800余萬次,獲利3800余萬元,警方在公司服務器中查獲并收繳被非法獲取、存儲的公民姓名、身份證號、照片近1億條。
海量信息泄露的背后,是一整條完整的個人信息挖掘、收集、交易、利用的產業鏈,以及其所帶來的巨大利益誘惑。
在這條產業鏈上,公民個人信息被稱為‘流量’,可以隨意被打包倒買倒賣,甚至一個普通員工的電腦里都可以存儲著幾萬人的隱私信息。而一條包含了用戶姓名、身份證號、住址、電話、銀行卡號等個人信息的‘流量’,價格只有幾毛錢。
此前,公安部通報‘凈網2019’專項行動工作情況及典型案例時也提到,專項行動的成果之一是搗毀了一批為‘套路貸’提供技術、數據服務的科技公司。據財新報道,涉案的部分大數據服務商分別為新顏科技、聚信立、信川科技(同盾科技子公司)、魔蝎科技。
相比與C端與用戶直接接觸的貸款平臺,這些公司的名字可能并不為大眾所知,但他們所掌握的數據庫和客戶數量遠超過我們的想象。
在過去幾年時間里,伴隨著互聯網貸款行業的快速發展,他們以低廉的成本獲取用戶信息,再通過各種方式變現獲得了超額利潤,同時也裹挾了大量資本,頂著‘科技’的光環一往無前。
如今,這場殘暴的歡愉,終將以殘暴終結。但在一地雞毛之外,這個行業值得一場更全面的反思。
1
風口之上
時間回到2013年,時任阿里巴巴集團安全部技術總監將離職創業的消息一經傳出,投資圈里便開始躁動。因為,‘2013’、‘阿里巴巴’、‘互聯網金融’這幾個關鍵詞湊在一起,一個標簽呼之欲出——獨角獸。
那一年,余額寶問世、P2P崛起、移動支付普及,在阿里系的離職創業大軍中,互聯網金融成為了一個重要領域。那一年,何俊創辦銅板街,錢志龍試水愛學貸,被IDG緊盯的李治國出任挖財CEO,這些創業公司無一例外都成為了資本追逐的對象。
而蔣韜帶著幾乎是全‘阿里巴巴’的班底創立同盾科技,無異于手握一張天使輪融資百萬美元起步的底牌。風口之下,形勢一片大好。同盾科技產品總監祝偉當時剛剛升職拿到阿里巴巴的期權,還沒捂熱乎就轉頭加入了蔣韜的創業團隊。
華創資本的當家人吳海燕在與蔣韜見面后迅速敲定了這筆投資,并為蔣韜介紹了第一個客戶。IDG資本也參與了投資,天使輪的融資規模便在千萬級人民幣。資本、團隊、項目逐一到手,而這一切距離蔣韜離職不過剛剛一個月。
當然,并非所有的創業者都這般幸運。
同樣是2013年年下半年,羅皓在結束了一場為期一年零七個月的創業后,注冊了上海誠數信息科技有限公司,也就是后來我們熟知的‘聚信立’。見完了一波又波投資人后,他終于拿到了100萬的啟動資金,而等這筆錢到賬已是2014年年中的時候了。
如蔣韜般幸運也好,如羅皓般不易也罷,在2013年前后,一大批‘數據’公司如雨后春筍般涌現。但在互聯網金融剛剛萌芽的初期,在數據市場還處于一片混沌的時候,這些探路者的進程并不順利。
當時,在國外已經出現Sift Science、 Signifyd等利用大數據反欺詐的公司,其主要的客戶是電商,通過設計反欺詐監測模型,幫助電商平臺及其他公司監測虛假賬戶、虛假支付記錄、低俗內容等等,以減少損失。
最初,蔣韜想要復制這個路徑,通過SaaS服務先切入電商、支付市場。但是當時線下收單企業沒有風控需求;而線上支付主要被巨頭壟斷,而這些大公司都有風控部門,會依據自己的數據做評分、建模,并不會選擇與外部合作,因此同盾科技不得不轉而尋找其他方向。
事實上不只是同盾科技,羅皓此前已經在大數據領域有過一次失敗的創業經歷。當時那個項目主要是為用戶提供微博的精準營銷,但這一領域對于數據量級有著較高的要求,再加上社交數據壁壘高,客戶很難將其交給第三方,清洗挖掘難度也很大,最終他不得不關停項目。
與數據公司們在諸多領域艱難探索相對應的是,P2P行業以一種近乎野蠻的速度開始崛起。
數據顯示,從2013年到2015年,中國市場上P2P網貸平臺數量就從800家增長至2595家,累計交易規模超過1.4萬億。而從業務邏輯來看,網貸業務與數據業務有著天然的契合。
在這樣一個急速擴張的市場里,大部分P2P平臺的數據能力、風控能力卻極為薄弱。因為P2P平臺無法獲得央行征信數據,若要大規模展業,必須依賴第三方大數據輔助做風控。而這無形間也為同盾科技、聚信立這樣的公司創造了巨大的市場機會。
2
‘惡’的種子
2015年初,聚立信發布了一款新產品,標志著公司徹底放棄在社交等其他領域的數據服務探索,轉而專注于互聯網消費金融領域。
在該產品發布的同時,羅皓驕傲地向媒體宣布,在過去一年多時間里,該產品將數據分析的維度從50個擴展至5000+個,‘爬蟲’爬過的網站超過 100 個,接入數據接口增加到 80 個。
在今天看來,‘爬蟲’技術是個人信息泄露的罪魁禍首,但在當時它確是炙手可熱的‘寶貝’。作為一種誕生已久的互聯網技術,它幫助這些數據公司以最低的技術門檻和最低的成本迅速拓展數據源。
而對于第三方數據公司們,數據是一切商業模式的起點——沒有足夠的數據就無法建立起有效的模型,而模型的效果不好就無法吸引更多客戶使用服務,沒有數據源的擴充也就進一步喪失完善模型的可能。如此,環環相扣。
但這也成為了‘惡’的原點。
為了加快數據沉淀,不同公司都有一套自己的方法論。具體來看,聚信立通過B端合作來驅動C端主動授權提供個人信息。方法也很簡單,他們與大量的網貸平臺、小貸公司等合作,當后者接到貸款申請時,他們會要求用戶提供一份由聚信立提供的信用評估報告。
C端客戶為了順利從B端拿到資金,勢必授權給聚信立,聚信立就能直接到數據源去爬取借款人的相關信息,并將非標準化信息轉為標準化,最終形成對借款人的綜合評估。
同盾科技旗下公司‘數據魔盒’路徑也類似。他們在早期通過‘免費’的方式大量拓展B端平臺,‘認可效果再付費’是他們快速發展的重要戰略之一。同盾科技還拓展了許多跨行業的客戶,比如婚戀、航旅網站等等,這些數據都被納入數據采集的維度當中。
‘算法的上限是數據,如果說這個公司只是依賴于自己的數據去做分析,那么不管你招再牛的人、做再牛逼的算法,它的效果都是有上限的?!Y韜如是評價自己的商業模式。
在當時,這是一個看起來‘三贏’的生意,借款人獲得了資金,平臺有效控制了風險,第三方數據公司獲得了數據,甚至看起來沒有任何不合規——數據公司在爬取數據之前先獲得了用戶的授權。
但是,當用戶交出個人信息、數據公司以極低的成本聚攏了海量數據之后,‘惡’的種子便已經埋下。只是在市場發展早期,一切規則都尚未成型,互聯網貸款市場的急速擴張、資本市場的加速涌入,使得市場參與者們都來不及多想。
公開信息顯示,截止2015年10月,同盾科技累計服務客戶超2000家,這一數字在一年之后便增長至5000家。在數據調取上,同盾科技每天的數據被調取量約為3000萬,其中信貸業務平均每天約500萬筆。
也是在2015年,同盾科技完成B輪3000萬美元融資。
3
鮮花簇錦
高歌猛進的互聯網貸款行業也將數據公司帶入了發展的高峰。
2016年初,時任51信用卡CTO的周江翔離職,隨后便創辦了魔蝎科技;天翼征信前副總經理黃向前也離開供職多年的‘電信系’金融科技公司,出任新顏科技CEO;在銀行體系內有著豐富技術研發經驗的楊攸斌也‘下?!瑒撧k了白騎士。
馨金融根據公開資料整理
越來越多的有著專業背景和光鮮履歷的創業者扎進了數據行業。
這種現象的出現并非偶然。2016年,盡管P2P增速有所放緩,但現金貸平臺洶涌。數據顯示,這一年國內現金貸平臺數量有千家,放貸規模已達萬億量級,這是一個比P2P還要野蠻的領域。一個更直觀的例子是,僅二三四五一家平臺在2016年的放貸金額就增長了20倍。
而每一家平臺,從獲客到風控,再到催收都需要‘數據’的支持,而頻繁的數據調取、使用,讓數據公司賺的盆滿缽滿。
新流財經曾披露一份文件顯示,同盾科技在2016年的付費調用量已經達到4.99億次,這一數據在2017年攀升至18.08億次,到2018年進一步增長至驚人的22.87億次。與此同時,單次調用的價格也水漲船高,從2016年的0.09元/次增長至2018年的0.21元/次。
事實上,經歷了前幾年的發展之后,此時的數據公司們已經形成了完整的底層數據+產品服務+增值服務的業務鏈,可以為現金貸平臺提供從基礎數據到創新產品的全流程服務,需求如井噴般涌現。下圖是聚信立在2017年的主打產品和數據底層組成情況:
以聚信立為例,當時它的爬蟲接口,可授權爬取總計1200家網站覆蓋所有電商、社保網站,90%以上的公積金網站、主流保險網站,涵蓋央行征信、運營商數據、學歷學籍、信用卡賬單、電商數據等等信息。
由于現金貸平臺無法接入央行征信,當然它們獲得征信報告的意義也并不大,因為其覆蓋的用戶大多缺乏在傳統金融機構的信貸記錄。那么只能通過其它渠道的數據來甄別是否有欺詐風險、共債風險。
在這樣的背景之下,第三方數據公司們所扮演的角色已然發生了轉變。如果說之前他們更多是扮演金融‘外包’的角色,那么在建立了一定的客戶和數據基礎后,它們無形間成為了互聯網貸款市場中隱形的‘征信中心’,或者說‘信息共享中心’。
由于覆蓋的群體特殊,連持牌金融機構等開始尋求合作。
4
烈火油烹
上帝欲使人滅亡,必先使其瘋狂。
2017年下半年開啟的‘現金貸’整治不僅沒有讓這些數據公司及時收手,它們更隨著現金貸行業開始了‘最后的狂歡’。
‘只要有人還在借錢,就會有數據需求,而且行業越是收緊、風控越是嚴格,頭部數據公司的生意也就約好?!粋€從業者朋友如是感慨到。在巨大的利益面前,大部分數據公司都選擇忽略風險。
2017年年中,魔蝎科技便被媒體曝出,其開發的‘同業爬蟲’產品直接將其他現金貸平臺的放款額和風控數據爬出來,手段太過野蠻。當時魔蝎科技COO張俊九在內部信中表示,
‘未來2個月,我們將逐漸關停爬蟲業務,同時會啟動向已簽約客戶的賠償機制?!?/p>
然而,事后證明,魔蝎科技的爬蟲業務并未關停,反而變本加厲。
當時的現金貸行業已經陷入瘋狂,‘714高炮’等超利貸產品屢禁不止。為了在最短時間內收割最大的利潤,一些現金貸平臺瘋狂到,只要拿到運營商報告(通話詳單),能夠保證催收,就可以放款。
前述被調查的考拉征信,更是牽出了一條由數據公司主導的黑產鏈條——考拉征信從上游公司獲取接口后,又將查詢接口出售,非法緩存公民個人信息,供下游公司查詢牟利。
而更令人發指的是,這些上下游的公司不僅通過販賣信息獲利,還經營現金貸平臺,利用手上掌握的個人信息進行貸款推銷、軟暴力催收等等。
從某個角度來看,第三方數據服務本身就是一個生于灰色地帶邊緣的產業。一部分業務長在陽光下,不斷獲得資本的澆灌,向人們描繪著這個行業未來會開出燦爛的花、結出誘人的果。但另一部分業務卻潛藏在地底,不斷在法律和道德邊緣試探。
這場踐踏了法律與道德底線的狂歡,終究不可持續。
2017年,徐玉玉案發,開始引起全社會對于信息泄露的高度關注。
一個女大學生接到了為她‘量身定制’的詐騙電話,以教育部門下發獎學金為借口被騙走了全部學費。當晚,在報案后回家的路上,徐玉玉突然暈厥,不治身亡。此事掀起了一場關于數據行業的撻伐。
從2017年年中開始,中央網信辦、工信部、公安部和國家標準委等部門就開始密集合作,針對國內大數據行業野蠻生長中的各種亂象展開各種行動,先后將30家大數據風控平臺列入調查,其中就包括新三板上市公司數據堂。
調查結果顯示,在8個月內,涉案公司日均傳輸公民個人信息1億3千萬余條,累計傳輸數據壓縮后約為4000GB左右,公民個人信息達數百億條,數據量巨大。
進入2018年以后,重點垂直行業的數據監管力度進一步提升。尤其是新金融領域里,包括個人征信試點機構、上市公司等都屢屢受到波及。2018年11月,針對大數據行業亂象,監管再次帶走大量從業者調查。
眼下,數據行業迎來第三輪整治。杭州、北京、深圳等地全面排查數據公司,央行、‘兩高’等各部委接連下發打擊套路貸、加強個人信息數據保護等文件,連‘助貸’、‘催收’等業務鏈上的各個環節都被嚴查。
5
拷問未來
數據行業帶上‘緊箍咒’。
今年年中,國家互聯網信息辦公室發布《數據安全管理辦法(征求意見稿)》,文件系統地規定了網絡運營者數據收集、數據處理使用、數據安全監督管理等覆蓋數據全生命周期的綜合合規要求,以及強制捆綁授權、網絡爬蟲等新型數據安全問題。
隨后,《信息安全技術移動互聯網應用程序(APP)收集個人信息基本規范》最新版草案中則對于網絡支付、金融借貸等部分服務類型所需最小必要信息進行完善,內容包括不應強制讀取用戶的通訊錄,僅用于實現用戶借貸歷史查詢和處理用戶糾紛的使用要求下,可收集借貸交易記錄等。
數據行業的野蠻生長,就此畫上休止符,但由此引發的風暴卻遠未停止。
按照這個邏輯,不止是獨立的第三方數據公司,所有自身不產生數據(而又高度倚賴數據)的商業模式可能都將面臨艱難的處境。比如,金融科技公司、人工智能公司.....沒有數據的持續‘喂養’,如何迭代各種模型?
所以,長期來看,這一次數據行業的‘地震’,所波及的范圍可能比想象中要廣的多。在缺少了上游數據服務商以及其所提供的‘白名單’、‘黑名單’等服務之后,首當其沖的當然是那些缺乏風控能力的貸款平臺們。
此外,如果仔細查看這些數據公司的合作伙伴名單就會發現,他們的合作對象早已不止于所謂的現金貸、P2P平臺,消費金融公司甚至全國性銀行都在名單之列。事實上,已有持牌金融機構因供應商突然中止提供數據服務而暫停放款。
數據行業的隕落揭開了過去幾年新金融、新經濟盛景的另一面:通過在灰色地帶的試探催生了繁榮,犧牲隱私交換了便捷的體驗。而結果就是,發展越快、風口越盛,所引發的混亂和失控也就越觸目驚心。
一切的進步,都應該在底線之上,否則這些進步很可能會將我們引向更加黑暗、更加失控的未來。
(本文作者介紹:洪偌馨,資深財經記者、主持人,自媒體“馨金融”創始人。)
責任編輯:張文
新浪財經意見領袖專欄文章均為作者個人觀點,不代表新浪財經的立場和觀點。
歡迎關注官方微信“意見領袖”,閱讀更多精彩文章。點擊微信界面右上角的+號,選擇“添加朋友”,輸入意見領袖的微信號“kopleader”即可,也可以掃描下方二維碼添加關注。意見領袖將為您提供財經專業領域的專業分析。