文/新浪財經意見領袖專欄作家 孫立林
12 月 30 日,武漢市衛健委第一次發布了新冠肺炎的警告,在當時并未引起太多人的注意。
直到 1 月 23 日封城,民眾才普遍開始意識到危機,但全球變化的真正興起才悄悄開始發酵, 并未被廣泛洞察。
對于逝去生命的傷痛與疫情擴散的恐慌之下,科學與技術的作用也被放大到公眾視野,從疫苗的研發到小小健康碼的使用都會是不同視角的焦點,引發不同層面的爭議。在疫情之初始: 從武漢封城之初各地尋找與感染者同一輛列車的乘客信息、到武漢市社區沉降行動期間公布感染者及疑似感染者名單;到開始逐步恢復生產和流動:從各地健康碼的普遍發行與認定、到無所不在的人臉識別甚至是戴口罩的人臉識別。
當韓國剛剛開始大規模擴散之處,韓國政府采取了更為激進的安全政策,通過跟蹤相關人員 的位置信息來確保公共安全;而在歐美,則大多數人不愿意戴口罩,更不愿意接受廣泛的追 蹤與數據采集。
直到不久之前,疫情期間廣為使用的 Zoom 被曝隱私泄露,無數公司和個人每天高頻使用的視頻會議系統竟然也是每個人數據隱私的黑洞。在幾乎全球高度依賴互聯網工具的特定時期,也幾乎以病毒式傳播的速度引發了另外一個公共話題:即當人類遭遇到大規模公共衛生 危機時,個人的生命安全與數據隱私保護面臨的沖突應該如何抉擇?
選擇“安全”還是“隱私”
在當下的中國,幾乎沒有個人隱私可以安放的空間了。為了方便和快捷,普通用戶向互聯網 公司和相關政府機構開放了個人幾乎所有的行為數據、身份數據和交易數據。“用戶畫像” 這個詞精微的傳遞出了一個基本概念,即分布在不同 App 當中的數據如果組合在一起,幾乎就是我們個體完整的“數字生命”。而幾乎所有互聯網公司的主營業務,都日益集中到了廣 告和金融兩個領域,而這兩個領域對于個人數據的濫用已經到了登峰造極的境界。
在出現大規模突發異常和“物理生命”面臨巨大威脅的重要關頭,部分甚或全部的將個人的身 份數據、行為數據等提交或披露給政府、醫院、社區和相關提供公共服務的互聯網公司,是 一種可以被普遍理解和接受的權宜之計。
但從長遠來看,新冠肺炎的異常或者其他的國家緊急狀態并非常態。今天人類面臨的最大“安 全”挑戰反而是來自于波瀾不驚的日常生活,即我們的“數字生命”的“安全”。這就是隱私與安全這個看似矛盾的博弈關系背后隱藏著的真正關聯。
無處不在的騷擾電話、個人身份信息的反復倒賣、個人數據的濫用牟利都已經構成了事實上對于公民個人自然權利的侵害,也事實上剝奪了每個人“數字生命”的一部分。在互聯網時代, 個人隱私數據的被濫用有可能導致個人無法設想的惡劣后果。
緊急狀態下可以授權政府或相關機構依法采集和在限定范圍內使用公民個人隱私數據,要求 公民披露相關隱私,這正如同征調物理個體履行公共義務,屬于公民應盡的義務范疇。但前 提是需要有完備的法律授權和嚴格的數據隱私保護,將特定的公共治理能力限定在一定范 圍之內。更重要的是當未來各種類型的公共危機化解之后,也需要第一時間解除對于公民個 人信息的集中控制和明文披露,恢復到對公民個人數據隱私的權利保護和尊敬的范疇內。而 這些都不能依賴于現有的技術手段和人為操作。特定的時代需求需要全新的基礎設施設和技 術,以可驗證的方式來捍衛人類的“數字生命”的基本權益。
“隱私計算”與“可計算資源”的思考
這種特定技術被廣泛的稱為“隱私計算”。隱私計算對于當下互聯網、AI、大數據、iot 等產業都具有顛覆性的變革意義。傳統的互聯網本質上是基于“數據交換”的網絡,所謂的“云 端”其實也還是在互聯網公司的邏輯“本地”。數據在明文狀態下的遷移不可避免的造成在 每一個環節的泄露;而隱私計算的根本理念是將計算遷移到數據所有者的“本地”來面向密 文做處理,這樣既明確了數據所有權與使用權、處理權三者之間的關系,又能夠事實上的啟 動數據的資產化、貨幣化和證券化進程。隱藏于背后的根本變遷是:從“數據交換”的傳統 互聯網演進到“計算互操作”的網絡和計算架構。
更加極致的理解是,在未來“數據”并不是一個可以被單獨度量和交易的對象,人類關心和 實操的對象本體是“可計算的資源”,也就是“可計算性”。數據的大量涌現和過度供給必 然會造成真正有效用的可計算資源的稀缺。這個才是對于人類生活真正有意義、有價值的“數 字化石油”,而不是泛泛的談論數據的“價值”。
當下有三種技術路線來試圖解決隱私有關的問題。其一是傳統系統安全領域出發,以 TEE 可信任執行環境為解決方案,代表廠商 Intel 和 Trustonic;其二是人工智能學界,以 Google 為代表的廠商推出的聯邦學習(Federated Learning)方案;其三是以密碼學為根基的隱私AI。
從最終商用視角來看,每種技術都有其特定的局限性和部署要求,在不同的場景和應用需求 下有各自的特色。但總體來說新一代隱私計算的大規模實現都需要高度依賴于密碼學的大規 模部署和商用。密碼學從數學理論上給出了一個系統的“可證明安全性”。也就是說一個系 統之中可計算資源的隱私屬性可以獲得的安全性的“極值”或者叫做“安全層級”,是由該 系統所能夠有效率的、可驗證的使用的密碼學基礎來決定的。
當然目前來看各種技術路線都存在不同的問題,面向商用的交付仍然需要時間來消解其計算 復雜度與通訊復雜度。
隱私 AI 的應用前景
隱私計算與 AI、大數據并不構成對立,而是會在人類普遍部署的大規模公共基礎設施之上系統性的支撐隱私計算能力。
或者說,未來的 AI 如果不能完備的兼容和承載隱私計算的需求,將無法投入實際使用。隨著深度學習算法等對于人類可計算資源的持續挖掘。公眾日益認識到數據的價值,所謂“隱
私”除去安全考慮之外,更多的表現為機構和個人的經濟利益。因為一切的可計算資源都可 以被度量為可交易的資產。
無所不在的 AI 已經穿透甚至侵入了個人和機構的“私有產權”領域,構成了潛在的惡。無所不在的監控、識別、登記和交易,如果不能從 法律和業務層面上做好分拆,則個人在未來的全數字化時代將無所遁形。
所有的應用場景也都源于以上的擔憂和利益變現訴求。另外一個掣肘隱私 AI 大規模商用的根本原因在于數據質量的不可驗證性。今天除了電信、金融等少數行業之外,其他絕大多數 領域的數據都還處于非格式化狀態之下,而且缺乏相應的數據格式標準。人類也無法完備的 驗證所有數據的真實性。就如同你并不能確認未來與你視頻通話的人是否是真實存在的個體,還是 Fake AI 做出來的一段代碼。
隨著歐盟 GDPR,加州 CCPA 法案的陸續頒布與實施,中國也將加速個人信息保護法案條例的出臺。在相應的法律框架下,圍繞著數據的所有利益相關方都需要重新審視過去對待數據 資源的態度和操作。
首當其沖的領域還是互聯網巨頭們盤踞的山頭:廣告、金融、醫療。今天可以在征信、大數 據風控、廣告、保險定價、診療服務、身份認證等各個細分環節引入隱私 AI,在接下來的3-5 年時間里,將會逐步的重構現有所有的云計算與大數據模式。
如今這個時代,每個個體都主動或被動的淪為了互聯網巨頭和成百上千個 APP 們的”血奴“,互聯網從人類使用的工具異化成了人類的目的。隱私計算開啟的時代將會從根本上扭轉 這一進程,重新將互聯網回到人類的“工具”角色。讓手機、智能手表、車載設備等無所不 在的、被動的“數據采集”過程重回人類個體本身的真正“選擇自由”。
回到疫情肆虐全球的當下,我仍然傾向于即便我們為了生命安全而在個人隱私權利做了取舍 和讓渡。但這并不是人類生活的全部和常態。每一個人都應該行動起來,為保衛我們自身“數 字生命”的安全而保持警惕,在全數字化時代的“黑暗森林”中尋求智慧與光明。
(本文作者介紹:現任矩陣元創始人兼CEO,Chinaledger創始成員及技術委員會副主任。)
責任編輯:張譯文
新浪財經意見領袖專欄文章均為作者個人觀點,不代表新浪財經的立場和觀點。
歡迎關注官方微信“意見領袖”,閱讀更多精彩文章。點擊微信界面右上角的+號,選擇“添加朋友”,輸入意見領袖的微信號“kopleader”即可,也可以掃描下方二維碼添加關注。意見領袖將為您提供財經專業領域的專業分析。