“爬蟲”兇猛 大數據風控平臺“黑幕”調查

“爬蟲”兇猛 大數據風控平臺“黑幕”調查
2019年09月27日 14:19 商學院

  “爬蟲”兇猛,大數據風控平臺“黑幕”調查

  文|呂笑顏 石丹

  作為現金貸風控的關鍵一環,第三方大數據公司在近幾年可謂風生水起。但由于數據的授權、來源、用途十分不透明,導致的隱私侵權、數據濫用等問題越來越嚴重。

  第三方大數據風控服務平臺正“風聲鶴唳,草木皆兵”。

  9月16日晚,一篇名為《同盾科技爬蟲部門解散,無意間掀起行業整治風暴》的文章在業內瘋轉,文章直指知名大數據風控平臺——同盾科技有限公司(下稱“同盾科技”)舉報杭州魔蝎數據科技有限公司(下稱“魔蝎科技”)與上海新顏人工智能科技有限公司(下稱“新顏科技”),引發了這次大數據行業風波。

  就在9月初,魔蝎科技、新顏科技兩家大數據風控服務商相關人員被警方帶走,隨后第三方數據服務公司聚信立、杭州有盾網絡科技有限公司(下稱“有盾”)、北京天機數測數據科技有限公司(下稱“天機數據”)等紛紛暫停爬蟲服務。

  9月11日,大數據服務商上海誠數信息科技有限公司(聚信立)被爆為積極迎合國家監管,暫停對外提供用戶授權的運營商爬蟲業務。

  緊接著,公信寶的運營主體——杭州存信數據科技有限公司辦公地被警方貼上封條。大概率是因為“爬蟲業務和數據”。

  9月12日,業界再爆天翼征信有限公司(下稱“天翼征信”)的多位高管及員工被警方帶走。

  有知情業內人士向記者透露:“公安部門正開展數據安全的專項整頓,而這一切的根源則是7.14高炮、現金貸平臺的催收案件調查。”

  那么,第三方數據公司在其中扮演了什么角色?爬蟲業務是如何“助力”催收亂象的?

  目前,第三方數據服務公司紛紛暫停爬蟲業務謹慎“觀望”。什么才是第三方風控平臺該有的健康的商業模式、未來行業如何良性發展等,仍有待監管與平臺不斷“磨合”。

  “風控獨角獸”深陷囹圄?

  上述名為《同盾科技爬蟲部門解散,無意間掀起行業整治風暴》的文章引述“同盾內部知情人士”的話,爆出“同盾科技爬蟲部門集體待崗、同盾科技實控人兼CEO蔣韜出國避風頭”等重磅內幕。

  文章發布次日,蔣韜在公眾微信號“智能風控聯盟”上發布了《心存敬畏向善而行》一文進行回應。

  對于文章所述之事,同盾科技相關負責人9月19日在接受《商學院》記者采訪時表示:“該報道中涉及同盾的多處失實,原發文章作者已經自行刪除,同盾創始人蔣韜也已經發布公開信表示‘心存敬畏,向善而行’,蔣韜先生一直在國內照常處理公司事務,一切業務正常開展。9月18日蔣韜在杭州接待富民銀行到訪,所謂‘跑路,出國避風頭’已經不攻自破。”

  該負責人還表示,“作為已經成為智能分析領域獨角獸的同盾科技,在市場上產品和技術早已經有口皆碑,完全沒有必要犧牲自己的羽毛做舉報之事。一直以來同盾以領先、可靠的產品立足于市場,服務于客戶,堅持良性競爭,任何時候均未考慮以不正當手段與友商競爭。”

  不過,據某頭部風控平臺高層分析,“相比而言,同盾科技的業務風格比較激進。”

  據企查查顯示,同盾科技成立于2012年10月10日,為國內第三方大數據風控服務提供商。其中,蔣韜為法定代表人、創始人及高管。資料顯示,蔣韜在取得復旦大學計算機軟件和理論碩士學位后加入IBM全球化研究院,2009年加入阿里巴巴擔任安全部技術總監,隨后創立同盾科技。據官網顯示,同盾科技入選了全球知名創投研究機構CB insights 2018年5月發布的全球Fintech“獨角獸”榜單。

  據悉,同盾科技子公司杭州信川科技有限公司(下稱“信川科技”)旗下有數聚魔盒品牌。據公開報道,數聚魔盒是基于云平臺、云計算、機器學習等技術,通過數據采集能力和數據挖掘能力,對用戶進行風險評估,幫助企業客戶深度剖析其用戶的誠信畫像。該報道還指出,憑借團隊多年積累的爬蟲技術經驗,魔方產品的基礎平臺能夠支持每天千萬級的調用量,和上千個數據源的服務能力。

  關于爬蟲業務,以及爬蟲部門已解散、該部門員工集體待崗等情況,相關負責人對記者表示:“信川科技自2018年開始已逐步調整業務,截至目前已全部停止相關服務。調整過程中相關員工均已正常調整至其他崗位,目前均正常工作。”

  停業觀望,爬蟲助“現金貸”催收

  對于此次行業風波,上述業內人士向記者透露:“公安部門正開展數據安全的專項整頓,而這一切的根源則是7.14高炮、現金貸平臺的催收案件調查,這些案件的調查引起了他們對數據信息的注意。”上述頭部風控平臺高層透露:“此次事件主要是爬蟲服務涉及的數據方面。其實在被查的幾家公司里,只有魔蝎科技的數據幾乎全是依靠爬蟲技術,其他兩家其實本身是有自己的數據的。”

  據此,事發次日,魔蝎科技官網已無法打開。據多家合作機構反饋,他們與魔蝎科技的服務突然被終止,魔蝎科技提供的賬號也已無法登錄。

  據企查查信息顯示,杭州魔蝎數據科技有限公司成立于2016年1月,法定代表人為周江翔,注冊資本1000萬元人民幣。其主要業務是提供精準營銷模型、反欺詐、多維度用戶畫像、授信評分、貸后預警、催收智能運籌等全面風險管理服務。此前,曾先后獲得MFund魔量資本、邦盛科技投資。

  關于魔蝎科技被調查的原因,據多位業內人士猜測,或與數據抓取業務涉嫌侵犯隱私、助力暴力催收有關。

  據官網顯示,截至目前,魔蝎科技已為國內多家銀行、保險機構、消費金融、互聯網金融等超過2000家企業提供了相關金融風控產品和服務,累計服務用戶數更是超過了1億。

  事實上,在2017年11月8日,文章《爬蟲兇猛:爬支付寶、爬微信、竊取現金貸放貸數據》就對大數據行業的“同業爬蟲”產品直接將其他現金貸平臺的放款額和風控數據爬取出來做風控,顯露出了擔憂。文章甚至特別點名稱魔蝎科技開發的“同業爬蟲”產品是“竊取別人家的勞動成果,太野蠻”。

  除了涉嫌利用技術手段侵犯用戶隱私、買賣公民個人信息外;魔蝎科技還涉嫌自營現金貸業務,其對外投資了杭州信邦科技有限公司,后者曾發布現金貸產品信邦貸和現金分期云平臺。

  針對被調查原因、為現金貸公司提供風控服務時抓取的主要信息、運營狀況及轉型規劃問題,記者試圖聯系魔蝎科技方面,不過,多個電話并未有人接聽,記者向對方發去采訪函,截至發稿,并未獲得回復。

  在魔蝎科技遭調查傳聞不到一周,同業公司聚信立也被傳遭警方上門調查。

  據企查查顯示,聚信立隸屬于上海誠數信息科技有限公司,據官網顯示,該公司成立于2013年7月,是專注大數據智能解決方案的服務商,主要為銀行、保險、消費金額公司、貸款機構等提供智能風控、風險分析、信用分析、多頭借貸、風控建模等一站式風控技術解決方案。

  據悉,近日聚信立曾向商戶下發通知稱,為積極響應國家日益收緊的監管政策,保證所有商戶業務運作的合法合規,聚信立將對現有的業務板塊作出如下調整:2019年9月6日23時起,聚信立將暫停對外提供用戶授權的運營商爬蟲服務。

  針對暫停爬蟲服務的原因、為現金貸平臺提供大數據風控服務時抓取的信息、此次風波的影響等問題,記者聯系聚信立方面,不過,截至發稿,并未得到明確回復。

  爬蟲服務到底犯了什么錯?

  據百度百科顯示,所謂“爬蟲”其實是一個自動提取網頁的程序,其按照一定的規則,自動抓取互聯網信息并存儲到自身數據庫的程序或者腳本。在用戶授權后,風控數據提供商可通過后臺“爬蟲”搜集信息,將通話信息、消費數據等互聯網信息整合標準化,最終形成對借款人的綜合評估,供金融機構做相應的后續決策。

  在金融風控行業,爬蟲業務曾被廣泛使用。它可以幫助風控機構進行信息整合、勾勒人群畫像,起到防范風險的作用。不過,有些機構卻借此竊取用戶手機號等個人信息,并服務于高利貸、暴力催收等違法行為,使得爬蟲技術面臨“是否經過用戶授權、是否存在過度爬取信息、爬取到的信息用途不明”等諸多爭議。

  據上述頭部風控平臺高層表示:“其實,爬蟲服務本身如果在客戶充分授權的前提下是可以用的,但是因為像一些第三方數據平臺使用爬蟲時,他們的數據來源往往說不清。更加嚴重的是,這些由爬蟲獲取的數據,會被一些比較下沉的金融平臺拿去做一些涉及暴力催收的事情。”

  而此次聚信立等停業或被查的大數據公司,客戶主要為消費金融機構和現金貸企業。

  作為現金貸風控的關鍵一環,第三方大數據公司在近幾年可謂風生水起。但由于數據的授權、來源、用途十分不透明,導致的隱私侵權、數據濫用等問題越來越嚴重。

  據上述頭部風控平臺高層透露,爬蟲技術一般所采集的信息包括:公開的第三方數據;抓取用戶主動授權的個人基本信息、聯系人信息、銀行卡信息等數據;授權抓取數據,如設備號、IP地址、運營商/電商等用戶授權后合規采集數據;經授權的平臺數據,如用戶在平臺的歷史借款、還款情況等用戶已在注冊協議或隱私協議中授權業務方進行分析的數據。

  在他看來,目前爬蟲數據不合法的行為表現在數據來源和數據用途方面,“數據來源不合法,就是在沒有收到客戶的授權的情況下去爬取這些數據;數據用途方面,就是爬取的數據最后通過什么渠道使用的,比如借助地理位置或聯系人的信息進行催收。不斷出現的暴力催收血案,也最終指向了這些爬取數據的公司。”

  在監管態勢逐漸趨緊的背景下,第三方大數據公司紛紛作出反應:目前,同盾科技、魔蝎科技、天機數據、有盾、聚信立、深圳白騎士大數據有限公司(下稱“白騎士”)等多家公司都已經主動或被動地停止了相關“爬蟲”業務。

  據上述知情業內人士表示,監管或有意從源頭整頓數據行業,90%的服務商都將暫停爬蟲業務,即便能活下來也必須要轉型,基本只能服務于銀行和持牌玩家了。

  第三方風控平臺數據之困

  按照上述邏輯,隨著監管信號的不斷釋放,野蠻生長的大數據收集時代進入冷靜期。那么,受到影響不只是獨立的第三方數據公司,所有自身不產生數據而又高度倚賴數據的商業模式可能都將面臨艱難的處境。例如,金融科技公司、人工智能公司等等。

  模型沒有了數據的持續“喂養”,又將如何迭代實現不斷優化呢?

  從長遠來看,在缺少了上游數據服務商以及其所提供的數據服務之后,那些缺乏風控能力的中小現金貸平臺、網貸平臺們勢必受到影響。

  實際上,細查此次數據公司的合作伙伴名單,可以看到的是,目前他們的合作對象不僅包括現金貸、P2P平臺,消費金融公司甚至全國性銀行都已經在其名單之列。

  那么,如何整肅現金貸爬蟲技術涉嫌侵犯隱私的產業鏈?

  在上述頭部風控平臺高層看來,應當盡快制定完善針對網絡爬蟲的數據安全法律法規,將網絡爬蟲引向合法軌道。若是違法進行網絡爬蟲,就要重拳出擊,加大懲罰力度和偵查力度,涉及刑事犯罪的要重點處理。

  在上述業內人士看來,未來監管環境會越來越嚴格,他說:“未來監管對于灰色地帶的法律執行會更加嚴格,如必須獲得用戶的授權;授權必須是一次性的,不許插次和間歇等。其實,原本這塊的法律就存在,只是執行單位沒有較真,現在確實是認真執行了。下一步有可能出現類似于互聯網金融協會,或者一些‘國家隊’,由國家牽頭,把大的實力比較強的頭部企業拉出來,組成風控聯盟,這符合中國的國情。”

  不過,他認為這個過程是有阻力的,“按照現在的情況來看,最大的阻力是由誰來牽頭、未來行業自律如何規范,這其中需要不斷地博弈,如什么樣的數據能用、授權到什么樣的程度,這個平衡是很難的。”

  據悉,近幾年大數據風控市場主要有三類玩家:一是傳統征信公司,如人行征信、鵬元征信、前海征信,為“國家隊”;二是同盾科技、百融金服(全稱“百融金融信息服務有限公司”,現已更名為“百融云創科技股份有限公司”)等新興垂直類大數據風控公司,主要采集、整合各類基礎數據進行大數據風控,為銀行、互聯網金融機構等提供風控模型和數據,并且逐漸積累了一些網貸數據積累;三是螞蟻金服、騰訊金融科技以及度小滿金融這類互聯網巨頭公司,主要基于自身生態鏈的電商、社交、搜索數據,形成風控產品和數據輸出能力。

  當前,P2P行業持續出清的過程中,各家企業都在尋求轉型,隨之而來的是風控服務的行業競爭將加劇。

  在上述頭部風控平臺高層看來,在激烈的競爭中,數據服務商的核心競爭力還是數據,最重要的能力是獲取豐富的數據源,以及構建精準的風控模型。因此,必須與各類擁有數據的機構建立深度合作,獲取豐富的或者獨家數據來源,才能屹立不倒。

  那么,如今監管不斷加強的態勢下,想要隨意地獲取信息勢必會越來越難,風控服務商們原本的商業邏輯是否需要轉變?

  據上述頭部風控平臺高層表示,實際上,目前第三方風控服務商的商業模式面臨諸多矛盾之處。由于沒有個人征信牌照,很多第三方風控服務商對外宣稱不收集、留存客戶數據,與其他機構合作僅提供風控模型輸出。但是,好的風控模型需要不斷優化,這需要掌握客戶的多維度、大批量數據。因此,在未經客戶許可的情況下,很多第三方風控服務商是沒有資格查看個人客戶的征信信息的,而這樣風控模型就無法優化。所以說,部分風控服務商的商業模式值得商榷,需要進一步調整,否則政策風險較大。

  那么,未來風控公司好的商業模式是什么?如何做到既符合監管標準,也符合科學的發展路線,有創新、既“利他”又“利己”呢?

  上述頭部風控平臺高層表示:“好的商業模式,只有金融科技公司一方努力是不夠的,以美國的市場為例,需要監管層、相關的法律法規來約束市場參與者的行為,包括服務使用方和服務提供方,同時,監管層需要對什么東西可用、什么東西不可用、該怎么用,都應該有一個明確的規定、要求,這樣大家就可以在合規的情況下,在遵守游戲規則的前提之下參與競爭,這樣才有利于市場的繁榮發展。在此基礎之上,金融科技公司應該在框架約束之內,盡可能地探索、在技術上做一些創新,然后更有效地識別風險。”

  近一兩年來,P2P暴雷潮與互聯網金融監管趨嚴導致第三方風控機構的客戶數量銳減,它們已經逐漸將服務重心轉移到銀行等傳統金融機構方面。不過,在上述頭部風控平臺高層看來,轉型傳統金融機構的前期依舊是有數據,他說:“跟銀行合作,仍然需要用訓練出來的這些數據產生評分,沒有這些數據產生評分,銀行業不會跟你合作。如果沒有數據,那么只能輸出技術,比如教銀行怎么建模,這個空間是非常有限的。”

  第三方大數據風控平臺究竟要如何發展,《商學院》將持續關注。

責任編輯:趙子牛

熱門推薦

收起
新浪財經公眾號
新浪財經公眾號

24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)

7X24小時

  • 10-14 渝農商行 601077 7.36
  • 10-10 米奧蘭特 300795 --
  • 10-09 八方股份 603489 --
  • 10-09 交建股份 603815 5.14
  • 10-08 佳禾智能 300793 --
  • 股市直播

    • 圖文直播間
    • 視頻直播間