中國防疫神器“健康碼”是怎么運轉的?

中國防疫神器“健康碼”是怎么運轉的?
2022年01月25日 07:30 中國新聞周刊
2021年7月30日,旅客在湖南長沙高鐵南站掃健康碼。圖/中新2021年7月30日,旅客在湖南長沙高鐵南站掃健康碼。圖/中新

  “數據宇宙”中的健康碼

  本刊記者/苑蘇文

  發于2022.1.24總第1030期《中國新聞周刊》

  一張巨大的由算法引擎織成的細密的網,是口罩、核酸檢測與隔離之外,中國阻止新冠病毒復制傳播的另一大利器。到了新冠肆虐的第三個年頭,這個數字防御長城已趨近完善。

  在有14億人口的中國,每個人都能通過智能手機調取一張健康碼。這是在紅黃綠間變化的二維碼或條形碼,三種顏色在后臺由大數據算出,提示持碼人不同的感染風險狀態。不同地方的健康碼還展示不同的其他信息,有的展示照片,有的提示行程,還有的標識著打了幾針疫苗,為防止截屏偽造,大多數都嵌入動畫和定時刷新。

  除了對外展示感染風險,健康碼還負責采集更精準的位置信息。中國遵循“動態清零”政策,每個人要為自己的出行和潛在的病毒傳播負責。在大多數城市,當你出入公共場所,會被要求在門口掃碼登記,而手動的掃碼登記,比被動的手機基站定位誤差更小。

  健康碼由各地政府主導開發,企業提供技術支持。毫無疑問,用以檢測每個人健康風險的“底層數據”,涉及大量個人隱私。但接受《中國新聞周刊》采訪的政府相關部門及企業人士都保證,對于這些隱私信息,企業僅提供技術支持,并簽署了嚴格的保密協議。而自2021年9月1日起施行的《中華人民共和國數據安全法》,也為數據的安全上了一道“緊箍咒”。

  快速上線背后的大數據戰略

  健康碼的第一行代碼已經寫進了歷史,更準確地說,它已經成為中國國家博物館的館藏。玻璃柜里的那行代碼,創建于2020年2月13日晚8點34分,是浙江省健康碼引擎的開端,并在40個小時后上線測試,這是全國第一個省級健康碼,脫胎于幾天前的杭州余杭區健康碼和杭州健康碼。

  杭州市余杭區,是阿里巴巴公司西溪園區所在地。2020年2月4日,余杭區就提出探索復工復產時疫情防控的數字化方案,“全人群覆蓋+全流程掌辦+全領域聯防”。公開報道顯示,依托于支付寶、釘釘、阿里云的技術力量保障,2020年2月5日凌晨5點,誕生了余杭健康碼的第一個版本,在以小時計算的迭代升級中,健康碼在24小時內推廣至杭州,又在幾天內推廣至浙江省。防疫新理念“病毒式”傳播,一周之內已經落地超過100城。到了2月15日,國務院辦公廳電子政務辦指導支付寶、阿里云加速研發全國一體化政務服務平臺疫情防控健康碼系統,加速了健康碼走向全國。

  各地在健康碼探索中,并不全都依賴“互聯網大廠”。在杭州往西南1650公里的貴州省貴陽市,云上貴州大數據(集團)有限公司(下稱“云上貴州”)承擔了貴州健康碼的開發。云上貴州是貴州省國資委控股的國企,其業務指導單位是貴州省大數據發展管理局。

  從2020年2月13日到2月18日,云上貴州團隊只用了6天完成貴州健康碼的全省上線。“貴州很低調。”云上貴州黨委副書記、董事、總經理魏巍曾在公開場合表示,六天開發上線的貴州健康碼,第一批接入了國家系統,“我們當時是最簡化,也是最全”。

  萬永波是云上貴州技術開發部副總經理,帶領團隊完成貴州健康碼的開發。他告訴《中國新聞周刊》,在開發健康碼的前兩天,他與團隊成員通宵達旦地向貴州省大數據發展管理局、省政府辦公廳、衛健委和以公安廳為主的貴州省疫情防控領導小組社會防控組(簡稱“社防組”)部門溝通,收集需求。“白天去各個部門,晚上回來匯總需求,由領導統籌方案,第二天白天再去匯報”。

  調研工作結束后,就是緊密鑼鼓的部署開發,既包括應用系統的部署,也包括數據收集的部署,其中,數據收集采用了最原始的方式,派人去各政府單位“駐點”。

  “信息流轉非常難,我們純用人力去跑,派了很多人到大數據局、辦公廳、衛健委和公安局去駐點,拿到他們的數據之后傳回公司。”萬永波的數據處理團隊有六個人,三人分為一組,12小時工作制,兩班倒,“只要那邊數據來了,這邊就馬上處理入庫”。

  在貴州健康碼最初的后臺數據庫,會根據數據的不同,將居民判定為五種狀態,在健康碼展示中分為紫、紅、橙、黃、綠五種顏色,其中紫色需要集中治療,紅色需要集中隔離觀察,橙色需要居家隔離,黃色需要定期做核酸檢測自我觀察,綠色則為無風險。萬永波介紹,數據進行初步處理后,由研發團隊將其合并入“大數據集群”,再向健康碼提供服務,而小程序的開發也在同時進行,在第五天時,這些工作基本結束,第六天小程序進行了壓力測試,第七天正式上線。

  能在幾天之內將政府數據全部聚攏,得益于貴州省的數據發展戰略。2014年,“云上貴州”注冊成立,2016年,貴州省成為首個國家大數據綜合實驗區,并成立了省大數據管理發展局,其致力于打造“一云一網一平臺”,等到了2020年,已經擁有了打通政府各部門“數據孤島”的基礎。

  大數據已成為國家戰略。在2021年12月29日,國家發展改革委等部門下發通知,加速推進國家“東數西算”工程,啟動建設全國一體化算力網絡國家樞紐節點,節點共有八個,分別是貴州、甘肅、內蒙古、寧夏,以及京津冀、長三角、成渝、粵港澳地區。西部發展大數據,有成本低的好處。記者獲悉,貴州健康碼的開發和運營,至今僅投入1500萬元,不及東部某省該項目投入的1/10。

一些社區對進出車輛、人員要求掃描健康碼登記行程。圖/人民視覺一些社區對進出車輛、人員要求掃描健康碼登記行程。圖/人民視覺

  數據收集邏輯

  疫情陰霾下,健康碼的后臺服務器是永不停歇的大腦,不斷計算著每個人的健康狀態。貴州數據寶網絡科技有限公司產品研究院院長、華東江蘇大數據交易中心副主任李可順告訴《中國新聞周刊》,每個人的健康狀態以字節的方式存儲于健康碼的服務器中,并隨著防疫政策和疫情形式的改變不斷刷新,當居民出示健康碼時,只是從后臺調取這個狀態,并顯示為不同顏色的二維碼。

  二維碼于20多年前由日本人發明,隨著移動支付的興起,成為近幾年移動設備上最流行的編碼方式,它比傳統條形碼能存更多的信息。李可順指出,大多數城市選擇不同顏色的二維碼展示居民健康狀態,目的是為了保護隱私數據安全。“健康碼的小程序一般依靠微信或支付寶等第三方平臺,只顯示二維碼可以保證隱私數據掌握在政府手上,不易泄露”。

  健康狀態經由哪些數據判定?李可順介紹,健康碼背后包括四大數據,第一是公安部門的戶籍信息;第二是自己申報的健康數據,比如體溫及當前癥狀;第三是行程數據,既包括通信管理部門協調運營商提供的手機信令位置,也包括鐵路和航空交通出行數據,以判斷是否到達過風險地帶;第四是由衛健疾控部門提供的就診信息,及判斷是否與確診者有交集。

  貴州省大數據管理局應用推廣處處長洪浩告訴《中國新聞周刊》,在貴州健康碼的運營過程中,主要關注重點人群,其中包括通信管理局推送來的與確診者或密切接觸著的“時空伴隨”人員、社防辦排查推送的高風險地區入境人員,以及衛健系統推送的確診人員或密接和次密接。重點人群被分成高風險人員和中風險人員,獲得這些人員信息后,健康碼會響應,并與省社防辦聯動,開啟進一步的排查和處置。

  防疫變得越來越精細化。過去,中高風險區域往往以城市為單位,通信管理局將有過這些風險區軌跡的人員悉數推送來,人數眾多。但現在提出了“時空伴隨”概念,風險范圍進一步縮小。 

  “時空伴隨”主要靠手機信令來定位。它的規則是,在方圓800米的范圍內,與風險人員的手機信令共同停留大約10分鐘時間,就會判定可能會有接觸,會被標記為風險人員的時空伴隨人員。時空伴隨人員的計算不屬于地方,由國家工信部信管局牽頭,幾大運營商根據基站和信號進行綜合定位,這需要更多的算力。最終的目的是減少了防疫擴大化,將方圓幾十甚至幾百公里的封鎖范圍縮小至幾百米。

  洪浩解釋說,時空伴隨數據由運營商完成計算后,統一交給工信部,再由后者向各地統一分發。“運營商的管控精度要高一些。”他說,原則上沒有大需求的時候,工信部每天會推送時空伴隨人員數據,而對于一些重點區域的時空伴隨人員,“實際上是實時更新的”,比如對最近暴發疫情的陜西、天津等地,對于離開那些區域的人員,如果要進入貴州,他們的時空伴隨情況就會被快速推送過來。

  李可順指出,盡管目前各地數據已共享至全國統一平臺,但仍是以省為單位在服務器后臺分析數據。在重點區域,則不斷通過刷新,更新每個人的最新動向與健康狀態。刷新頻率和當地是否存在疫情傳播風險有關。“就像我們刷網頁,刷新是耗流量的,就得花錢,所以如果沒有疫情刷新就慢,如果在重點區域就會不斷刷新,監控人員流動可能帶來的風險。”他指出,像是上海浦東機場這類出入境人員較多的地方,每人信息的刷新應該“特別快”。

  在大多數地方,除了要亮健康碼,還需要亮出行程卡。行程卡是由工信部推出,基于運營商的基站數據,判斷人14天內的行程,如果有城市存在中高風險區,城市名稱上會用星號來標識。李可順指出,實際上行程卡基于手機信號基站定位的位置數據,在健康碼的數據中是包含的,但之所以開發行程卡作為輔助工具,主要是因為健康碼沒辦法展示近十四天的行程信息。

  “目的就是為了更精準地定位。”李可順說,疫情之下,健康碼給人員流動提供了保障,讓人們能安心復工和通行于公共場所。“健康狀態掌握在政府手里,假如有感染風險,馬上就能定位到此時此刻的位置,然后再進行網格化的處理,有一整套響應機制和流程。”

  各顯神通

  在健康碼推行初期,各地單獨立項制作健康碼,信息采集標準也有所不同,因此難以達成互認。李可順指出,主要是各省單獨立項制作健康碼,標準和數據使用維度都不同,甚至在后臺留存的居民健康狀態,也使用不同的字節去記載,這令各地相互轉碼也很困難。在同一個省,也出現了省會和其他城市用兩套健康碼,比如在陜西就并存“西安一碼通”和“陜西一碼通”。

  各地用健康碼定位的方式也不一樣。不同于許多地方在進入公共場所時需掃描場所碼進行登記,貴州省的貴州健康碼只需要打開,就會自動上傳定位。洪浩介紹,貴州健康碼設計之初,就確定以“最快通行”作為原則。盡管掃描場所碼登記,可以對人員所進入的公共場合精準確認,但亮出貴州健康碼時所發送的定位,誤差也不會超過10米范圍,盡管無法確定在哪家店,但如果出現感染者,同樣可以將周圍的密切接觸者排查出來。省去場所碼登記這一環,可增加通行速度。“如果流程太復雜的話,防控上反而容易有疏漏了,刻意追求定位的精準,反而可能帶來新的風險”。

  在2020年上半年,各省健康碼數據沒有共享平臺。洪浩回憶,2020年3月前后,貴州省聯系了人員來往密切的廣東和浙江,進行了數據定向交換。到了2020年下半年,國家設立了“全國一體化政務服務平臺”,各省就將數據上傳至國家的平臺上,推送更新內容也是每日一次。

  為實現各地的健康碼信息互通互認,國家還制定了統一的數據采集標準,其中既包括數據采集的類型和維度,也包括數據字段的標識,以便數據互通。根據國家統一標準,貴州健康碼從五色變為三色。將紫色和紅色歸集為紅色,橙色保留,將黃色納入綠色進行管控。萬永波介紹,貴州健康碼上線之初到現在,已經經歷了150多次迭代升級。其中包括增加了核酸檢測預約登記功能、疫苗接種查詢功能,以及健康碼和行程卡共同顯示。

  近些天來,一些地方進行全城核酸檢測時,健康碼崩潰,引發熱議,萬永波指出,與許多其他地區的健康碼不同,貴州健康碼在核酸檢測、疫苗查詢和健康碼亮碼三個方面,采用獨立的技術架構。

  “據我了解,西安的健康碼之所以崩潰,是因為核酸檢測系統的查詢量并不能承載健康碼查詢的并發量,導致核酸檢測系統查不出數據了。為了避免這種情況,我們貴州健康碼使用了中間庫。”萬永波說,將核酸檢測分離為獨立的系統,檢測數據收集出來后,將會被傳遞到中間數據庫,當健康碼用戶需要查詢核酸結果,再連接到中間庫去讀取,“在這種情況下,假如核酸檢測系統宕機了,也不會影響健康碼系統的正常運行”。

  萬永波還介紹,為了減少服務器宕機時的影響,他們在服務器集群采用了“高可用”形式,即將幾十臺服務器建立成為集群,這其中若出現一臺或多臺服務器宕機,并不影響整體集群的使用。另外,他們還在聯通和移動兩個節點分別部署了健康碼后臺,當一個節點出現故障,能夠迅速切換到另一個節點。根據最新的壓力測試,貴州健康碼的核酸檢測系統,每秒能完成1萬人的核酸檢測,“一分鐘就是60萬,完全能承受貴陽市的800萬人口”。

  不過,盡管如今各地數據已經打通,但在核酸檢測方面,仍不能做到異地同時查詢。其中一個原因,與國家信息平臺數據更新速率有關。這意味著,當你到達新的地方,此前的核酸檢測報告有可能無法同步在當地健康碼上,仍要按照當地政策重新檢測。

  隨著健康碼系統的愈發完善,疫情防控也將愈發精準。根據相關政策,國家要求不能以區縣以上為單位賦碼,要精準賦碼,避免“一刀切”。如今,風險區的劃分也越來越小,多以小區為主。不久前在上海,甚至將一家占地面積20多平方米的奶茶店劃為中風險地區,被成為“史上最小”,與之一墻之隔的理發店都可以正常營業。

  但健康碼仍有漏洞。對于不使用智能手機的兒童和老年人,目前采用登記為同行人的方式,如果老人單獨出門,則使用打印的紙質二維碼。李可順說,目前業內正在研究公路交通中以車為主的通行碼,加強來自風險地區的道路管控。另外,廣西等地,已經推出不需要聯網即可查詢的健康碼,“類似于緩存機制。”他說,健康碼小程序會有個定期輪詢個人健康碼狀態,存在手機,聯網時查后臺實時健康碼,斷網時直接提取緩存的健康碼。

  李可順說,未來健康碼還將可能富集更多功能,比如綁定銀行卡進行支付,以及在醫院就診。等到疫情過去,健康碼的使命并不會結束。“我們做了這么多底層數據的工作,肯定是有用的,有價值的。”他說,只要維持核心的數據狀態,持續將各方面數據打通,就能實時監控每個人的疫情狀態,如果沒有疫情,這些新的機制和經驗,也可用在其他應急事件上,“比如搶險救災,再比如追蹤資產和逃犯”。

新浪科技公眾號
新浪科技公眾號

“掌”握科技鮮聞 (微信搜索techsina或掃描左側二維碼關注)

創事記

科學探索

科學大家

蘋果匯

眾測

專題

官方微博

新浪科技 新浪數碼 新浪手機 科學探索 蘋果匯 新浪眾測

公眾號

新浪科技

新浪科技為你帶來最新鮮的科技資訊

蘋果匯

蘋果匯為你帶來最新鮮的蘋果產品新聞

新浪眾測

新酷產品第一時間免費試玩

新浪探索

提供最新的科學家新聞,精彩的震撼圖片