宋一民:守護“數據池塘”的新創客

宋一民:守護“數據池塘”的新創客
2021年06月17日 22:41 法人雜志

股市瞬息萬變,投資難以決策?來#A股參謀部#超話聊一聊,[點擊進入超話]

  宋一民:守護“數據池塘”的新創客

 

  ◎ 文 《法人》全媒體記者 李遼 彭飛

  格子襯衫、框架眼鏡、牛仔褲、運動鞋,一眼便可識別的程序員打扮,談到計算機與網絡,眼神活泛,滔滔不絕……宋一民身上涌動著扎克伯格般“極客”的神采。但身為年輕一代的創業家,在他這份清秀和干凈的少年感之下,卻又蘊藏著一種溫文爾雅、張弛有度的穩重。

  2019年初春,決意作別美國的親友回國創業時,宋一民正在美國Facebook從事隱私工程相關工作。這樣的決定意味著,他要與高額的年薪、前沿的科技環境、逐年增長的股權激勵作出割舍。對于剛剛33歲的宋一民而言,作出這一決定“其實并不糾結,也不痛苦”。想出來創業的想法由來已久,而多方安全計算理論上的突破使其在工業界落地成為了可能,加之全球對隱私合規的重視加劇以及對數據流通價值的理解加深,宋一民覺得,時機到了。

  他的合伙人、同為Facebook員工的蔡超超似乎“代價”更大。彼時蔡超超剛剛獲得公司百萬美金級的最高獎金,且剛剛升職。盡管在蔡超超看來,宋一民的這個決定相當大膽,但他仍然愿意一同回國創業。

  宋一民與蔡超超決意要做的隱私計算技術方向,之前曾在2017年年初由宋一民在Facebook廣告部門提起,并做了一些嘗試。這項技術旨在實現“數據可用而不可見”的愿景,宋一民在國內做過調研,當時尚無這樣的技術落地,他預見這項技術必將能填補國內該領域的空白,“簡單來講,有多個相互獨立的數據池塘,在確保不讓魚出池塘的情況下,通過這項技術,精確了解到關于魚的各項匯總數據。在過去,可能需要把各個池塘的魚混在一起,才能精確計算出這些數據,但這樣做不僅池塘主不愿意,監管也不允許?!?/p>

  2019年8月,數牘科技正式在北京創立,宋一民任CEO,蔡超超任CTO。公司拿到了國內頂級投資機構的數千萬元投資。憑借著隱私計算領域的技術優勢,短短不足兩年時間,數牘科技迅速與中國聯通、多個國有銀行等達成戰略合作,業務量逐漸攀升。

  近期,成立不足兩年時間的數牘科技即將迎來新一輪融資,宋一民透露,這一輪的估值已經超過1億美金。

  隱私保護危機引發的決定

  在數牘科技的大開間辦公室中,宋一民的工位在進門第一排的靠邊位置,在整個團隊中并不顯眼。

  創業之前,北京人宋一民的生活似乎“波瀾不驚”,初高中就讀的北京八中,以寬松的教學環境在國內教育圈聞名。去南京郵電大學讀計算機專業之前,他的生活圈幾乎沒出過北京市西城區。大學畢業后,他去了美國得克薩斯繼續攻讀計算機專業研究生。當時金融危機剛結束,就業形勢嚴峻,與繼續深造相比,很多畢業生會優先選擇工作,宋一民因科研能力突出畢業后被微軟錄取,之后又在激烈的競爭中脫穎而出,來到了Facebook。

  在美國,計算機專業的學生畢業后被微軟、Facebook這樣的互聯網企業核心業務部門選中,基本意味著生活無憂。但宋一民一直有自己出來創業的想法,且一直在等待機會,“我做決策時非常謹慎,回國創辦數牘科技已經是我人生中做的最大決定了。”

  在2016年,在Facebook廣告的用戶數據部門工作的宋一民開始負責一些對外數據合作項目,他所在的部門要與各類數據提供者展開密切合作,但同時又要確保數據不被泄露。美國對侵犯用戶隱私的行為懲罰非常重,該部門在處理數據業務時都高度謹慎。2017年開始,作為技術主管,他負責過Instagram和Universal Ads等大型廣告服務項目的開展,還從0 到1主導了Facebook和500強企業的基于隱私保護的數據協作項目。

  隱私計算,其實是多種技術的組合,其中包含安全多方計算、聯邦學習和差分隱私等,它的目標是在保護數據安全和用戶隱私的前提下,為不同機構提供多方數據的分布式數據融合、聯合建模和數據使用。近些年,數據信息安全事件頻發,隱私保護和數據流動之間的矛盾日益凸顯,隱私計算或將成為解決這一矛盾的絕佳途徑。

  在幫助Facebook解決廣告業務中的用戶隱私保護問題時,宋一民時常拉著蔡超超一起頭腦風暴,“隱私計算本質上是要打破數據綁架,與Facebook的占據流量入口和成為數據匯聚點的戰略是相左的,在Facebook內部推這個項目很有阻力。所以,這個技術特別適合成立一個獨立的第三方公司來做。”

  蔡超超在Facebook作為技術領軍人物主導了多個項目,獲得了Facebook授予的Distinguished Equity(卓越獎),在機器學習、聯邦學習等領域擁有30多項美國國家專利。由于業務往來的需要,兩人一直有著十分緊密的合作關系。“那時,全世界做同類業務的公司不到10家,而且絕大多數公司只是做做樣子?!辈坛硎尽?/p>

  幾乎所有的互聯網公司都是盡可能地把別人的數據拿過來,而不把自己的數據給出去。重大轉折出現在2017年,谷歌AI在《聯合學習:協作機器學習沒有集中訓練數據》的博客文章中首次引入了“聯邦學習”的概念。不久后,中國國內首家民營銀行和互聯網銀行——微眾銀行,由于迫切的風控技術需要,將這一概念率先引入到國內。但應用在落地時,推進得并不那么迅速。

  2018年年底,IDC《數據時代2025》白皮書中預測,2025年全球產生的數據將高達175ZB,相當于每天平均產生491EB的數據。其中,相較于歐洲、中東、非洲、美國、亞太(不含中國)以及全球其他區域,在未來5年,中國的數據量平均增長率達到26%,預計到2022年將擁有全球最大的數據圈。

  大數據飛速增長隨之引發的問題接踵而至,全球出現了多個用戶隱私信息泄露事件。僅2018年,Facebook 5000萬用戶的信息被泄露,圓通10億條用戶信息數據被出售,前程無憂195萬條個人求職簡歷泄露,萬豪喜達屋5億客戶的用戶信息被泄露,順豐3億條用戶信息數據被出售,AcFun 900萬條用戶數據被泄露……隱私泄露事件頻發導致信任鴻溝,傳統數據交易無法確權定價,傳統數據融合方式存在著極大的安全問題和高昂的管理成本。

  此時的中國,既有將來全球最大的數據圈作為基礎,又有隱私泄露的各種危機事件發生,而數據作為生產要素,要產生經濟價值,合規使用客戶隱私一定是發展的必然。“國外對使用用戶數據的監管很嚴,但中國還存在一些灰色市場,具備良好的隱私計算技術的應用發展場景,能激發新的應用?!彼我幻癖硎荆霸趪鴥?,如果一個技術沒有從市場角度去反推,這個技術就很難落地,公司也很難存活。但國內市場接納度非常高,市場滲透速度很快?!?/p>

  多方共享數據卻無需交換數據

  宋一民斷斷續續在國內做了一些市場調研,2019年年初帶著創辦一家隱私計算技術服務公司的想法回國融資。他說:“我與一些投資機構進行了交流,但他們大多對這個方向沒有概念,當時也沒有相應的市場需求。但好在我們的商業計劃書在機構圈逐漸擴散開來,中國頂尖投資機構的負責人找到我,他們說一直看好這個方向,但觀望了很久,沒有找到合適的項目?!?/p>

  2019年4月,宋一民獲得了國內頂級投資機構天使輪投資,他覺得回國創業基本具備了天時地利人和的條件。幾乎沒有太久耽擱,宋一民火速拉攏到了一幫初創團隊一起回國,其中幾位是宋一民在Facebook的同事。

  “在Facebook,和我們類似資歷的人幾乎沒有人會選擇出來創業?!彼我幻穹Q,從這里離開,就等于要從安逸的美國生活中抽身出來。

  早期團隊的成員姚雪潔,是宋一民北京八中的高中同學。決定和他一起回國時,她是某知名電商公司的國際化產品負責人,已經在美國定居。數牘科技所要解決的問題,正是姚雪潔過去在投放廣告中經常遇到的痛點,“如果能把廣告投放主的數據給到廣告推廣方,廣告投放的精準度和效果將顯著提高,但同時,如果把數據給到推廣方,數據將會被后者留存,破壞了用戶的隱私安全,這是矛盾的地方。”所以當宋一民提出隱私計算技術時,同為計算機專業的姚雪潔很快捕捉到了這項技術的前景。

  數牘科技很快交出了答卷。2019年10月,第一版隱私計算產品出爐,正式完成了基于分布式的聯合建模,實現了之前向投資人承諾的“多方共享數據但又無需匯集或交換各方原始數據”的效果。這意味著,大數據實現了真正的共享,為“多方數據價值變現”找到了可行之路。

  “數據隱私問題存在于數據存儲、數據交換和數據計算三方面。數牘科技解決了在數據計算層面的隱私保護和數據安全,為雙方用戶在原始數據無需暴露的前提下進行聯合建模及計算,平臺不參與計算,不觸碰數據,不運營數據?!彼我幻窠榻B,數牘的隱私計算平臺,可以讓數據使用方得到數據計算結果,但無法看到加密數據內容,對于用戶來說,數據全程加密,充分保護用戶隱私,還能保證原始數據隱私安全。

  很快,合作伙伴紛至沓來。2020年上半年,數牘科技成為聯通數科隱私計算技術提供商,同時獲得了幾大國內頂級投資機構的Pre A輪億元投資;同年6—7月,與中國移動、招商金科、招商銀行浦發銀行共同開展了多個隱私計算試點工程項目;11月,與信通院、阿里安全共同發布國內首個隱私計算技術研究報告;同時,近兩年來,數牘科技還參與了工信部信通院、中國電子標準化研究院、北京大數據中心等多個機構的多項隱私計算、數據安全、數據流通分級分類的相關標準或指南。

  數據需要在場景中發揮價值,因此隱私計算要天然貼近業務場景。數牘在實踐中積累了包括銀行、保險、汽車廠商、電信運營商、政府等多領域的業務場景。同時,實現了高安全性和高計算性能的雙重突破,已達工業落地可用狀態。

  在金融板塊,銀行原有的風控模型受限于數據不夠豐富,在風控能力和獲客成本等方面面臨較大挑戰,因此,數牘科技與一些頭部銀行及頭部保險公司在車險定價、信貸風控、智慧零售、小微企業貸款、反洗錢、智能投顧等方面進行了深度合作;在政務領域,數牘的主要客戶為“十四五”規劃中區域數字經濟一體化的標桿省份客戶,如京津冀、粵港澳、長三角地區的用戶;在電信領域,基于電信數據能力、對外開放服務平臺,數牘打通了全行業互聯互通數據服務平臺,同時針對電信詐騙場景正樣本獲取難、數量少、模型能力不足的難點,協助移動和電信運用聯邦學習技術,在數據安全的前提下,融合雙方數據及模型經驗,提升詐騙賬號識別能力,將電信反欺詐場景落地;在互聯網領域,數牘與大型互聯網廣告平臺及廣告主合作,基于隱私保護的廣告及營銷協作場景等。

  創業之后的“甜蜜負擔”

  技術靠場景打磨。一個技術能發展出多個方向,而具體要選擇哪個方向要看市場的反饋。“美國許多科技公司和國內的一些早期的實踐者,在探索類似技術時還沒有機會在真正的大環境中落地,沒有辦法提煉出研發技術的關鍵邊界,也不清楚如何去判斷提升的優先級。但中國有培育這個技術天然的市場,數牘科技在幾大運營商和頭部企業的場景中通過實際的業務落地也在快速地落實相關的積累?!彼我幻駨娬{,“這一類場景,Facebook應該都沒有機會去實踐。”

  “從2019年年底到2020年年中,某數據爬蟲隱私泄漏事件的出現,讓大家意識到個人隱私保護的重要性,數據監管政策收緊,市場突然有了迅猛的發展?!睋ぃ袊壳坝?00多家企業都在做類似業務,有高??蒲袌F隊,有社會企業,因為很多企業都意識到了這塊技術在未來的發展。

  “2020年,在疫情的影響下,數牘科技全年營收達千萬級人民幣?!彼我幻穹Q,2020年的上半年,公司幾乎沒有簽任何合同,但從10月開始的3個月內,合作方陸續找來,一舉反超了“年營收力爭達到800萬元”的年初計劃。

  成績很明顯,但宋一民也有了“甜蜜的負擔”。他笑言,因為自己的很多行為會被看作代表數牘科技,如今自己說話做事少了很多自由灑脫,他的朋友圈幾乎沒有任何文字和圖片的分享。但實際上,他使用微信十分頻繁,“每天早上醒來,微信里的未讀消息都有幾百條?!彼贸鍪謾C看了看數字,“現在是523條?!?/p>

  從一個全球頂尖互聯網企業的技術負責人轉變為創業團隊創始人,宋一民現在必須要為自己一手創辦的數牘科技負責到底。他說:“我每天都在面臨各種類型的隨機挑戰,這些挑戰可能是我以前從未經歷過的?!?/p>

  末了,宋一民笑言,“這么看起來,創業仿佛不是一個性價比很高的決定?!钡陔[私愈發受到尊重的當下,在隱私計算這個全新的賽道,擅長宏觀戰略思考和方向判斷的宋一民一定是一個優秀青年創業家的典型樣本,沒有理由也不會選擇輕松的、“性價比很高”的人生。他注定會和數牘科技這匹黑馬一同,隨時代浪潮奔涌向前,讓數據的控制權回歸到擁有者手中。這個理想的實現也許路途艱辛,但一定不會漫長……

海量資訊、精準解讀,盡在新浪財經APP

責任編輯:劉萬里 SF014

APP專享直播

1/10

熱門推薦

收起
新浪財經公眾號
新浪財經公眾號

24小時滾動播報最新的財經資訊和視頻,更多粉絲福利掃描二維碼關注(sinafinance)

7X24小時

  • 06-18 海泰科 301022 32.29
  • 06-18 稅友股份 603171 13.33
  • 06-17 工大高科 688367 11.53
  • 06-17 寧波色母 301019 28.94
  • 06-17 利和興 301013 8.72
  • 股市直播

    • 圖文直播間
    • 視頻直播間
    新浪首頁 語音播報 相關新聞 返回頂部