來源:新智元
來源:ScienceAI
作者:余小飛
1990年正式啟動的人類基因組計劃(Human Genome Project, HGP)與曼哈頓原子彈計劃和阿波羅計劃并稱為三大科學計劃。
作為一項規(guī)模宏大,跨國跨學科的科學探索工程,HGP的宗旨是測定組成人類染色體中所包含的30億個堿基對組成的核苷酸序列,繪制人類基因組圖譜,辨識其載有的基因及其序列,從而達到破譯人類遺傳信息的目的。
2001年,人類基因組工作草圖的發(fā)布被認為是HGP成功的里程碑事件。2021年,距離人類基因組工作草案發(fā)表已過去20年。
在這20年中,越來越多的國家和團隊加入到此項計劃中。生物技術(shù)公司的參與也逐漸降低了測序的成本,提升了測序的速度和吞吐量。序列數(shù)據(jù)量的不斷增長,也推動了用于組裝和注釋數(shù)據(jù)的數(shù)學和計算工具的發(fā)展。
2月5日,美國《科學》(Science)雜志以人類基因組工作草圖發(fā)布20周年為專題發(fā)表了系列文章。在慶祝人類基因組工作草圖發(fā)布20周年的同時,《科學》也提出了HGP面臨的一系列問題,并以Complicated legacies: The human genome at 20為題發(fā)布了文章。
(來源:Science)
以下為編譯內(nèi)容:
數(shù)據(jù)共享精神,比以往任何時候都更重要
1996年2月,HGP領(lǐng)導者聚集在百慕大,共同商討出「百慕大原則」,即同意將超過一定規(guī)模的基因組測序數(shù)據(jù)在產(chǎn)生后的24小時內(nèi)提交到公共數(shù)據(jù)庫。公開數(shù)據(jù)的「百慕大原則」是在HGP期間產(chǎn)生的第一個人類參考DNA序列的基本遺產(chǎn)。自1990年代以來,這些原則已成為開放科學的試金石。
雖然有很多參與者共享了他們的數(shù)據(jù),但依舊有很多人只將數(shù)據(jù)共享給了一小群用戶,甚至在相關(guān)論文發(fā)表后仍保留數(shù)據(jù)。「百慕大原則」的獨特之處在于,希望將所有HGP資助項目的基因序列能在一天之內(nèi)發(fā)布給任何在線用戶。然而,實施這一政策并非易事。
需要倡導「百慕大原則」。在24小時內(nèi)發(fā)布數(shù)據(jù)仍是目標,而不是嚴格的要求。「百慕大原則」的靈活性允許較小的中心參與計劃,同時也允許該項目適應當時德國、法國、日本和美國不兼容的政策。此后,「百慕大原則」已適應不同的社區(qū),并為其他許多原則提供了靈感。
共享數(shù)據(jù)可以挽救生命。例如,快速的數(shù)據(jù)共享在當前的新冠疫情危機中至關(guān)重要。嚴重急性呼吸系統(tǒng)綜合征冠狀病毒2(SARS-CoV-2)基因組序列被快速確定,并在2020年1月10日被公布,這是疫苗開發(fā)和診斷測試的開始。
(來源:Science)
多樣性的缺乏阻礙了基因組學的前景
如果我們?nèi)匀恢饕P(guān)注歐洲血統(tǒng)的基因組,將會對人類基因組學的長期全球發(fā)展造成損害,并且也會阻礙人類對自身歷史和生物學的理解。
雖然所有人在非洲擁有一個共同的新近起源,兩個個體之間的遺傳差異也很小,但這可以轉(zhuǎn)化為約300萬個個體基因組的變異點,而這些人類遺傳變異體(HGV)并不是隨機分布的。
我們早已知道,不能完全基于地理位置的基因組分布去「尋根」,但目前的基因組學研究仍然主要集中在歐洲地區(qū)的基因組上。據(jù)推測,這是因為歐洲血統(tǒng)個體高大、特征鮮明,數(shù)據(jù)可用性較高。
但現(xiàn)在,個體基因的多樣性和代表性的認知已從專門研究的范圍提升到了對基因組學的廣泛了解。在不加劇健康不平等的情況下,為了在全球范圍內(nèi)部署以基因組學驅(qū)動的技術(shù)以及臨床和公共衛(wèi)生方法,我們必須研究不同祖先和地理背景的個人。
當然,大家也開始意識到日益多樣化的人群對基因組學的影響,TOPMed計劃、國際常見病聯(lián)盟、非洲人類遺傳與健康(H3Africa)、百萬退伍軍人計劃,GenomeAsia等計劃,以及我們所有人為研究基因多樣性和包容性的發(fā)展做出了貢獻。
(來源:Pexels)
釋放算法生物學的潛能
2000年,加州大學圣克魯斯分校的研究生Jim Kent創(chuàng)造了第一個基因組組裝軟件。GigAssembler將全球?qū)嶒炇耶a(chǎn)生的數(shù)百萬個DNA序列片段拼湊在一起,將人類基因組「呈現(xiàn)」出來。
幾乎同時,Celera Genomics收購了算法軟件公司Paracel。Paracel擁有專門設(shè)計的文本匹配硬件和軟件(TRW快速數(shù)據(jù)查找器),可在廣闊的基因組空間中尋找基因。
想要解開混亂的基因組字母,需要在很大的基因組空間里快速而準確地搜索到指定序列,這就需要新形式的培訓和學科專業(yè)知識。物理學家、數(shù)學家和計算機科學家將諸如線性編程、哈希和隱馬爾可夫模型等方法帶入了生物學。
自2005年以來,類似于摩爾定律的下一代測序技術(shù)的發(fā)展產(chǎn)生了越來越多的數(shù)據(jù),并且需要更快的索引和搜索算法。生物學業(yè)界人士借用了「大數(shù)據(jù)」方法,這也推動了計算機科學研究的前沿發(fā)展。
圍繞算法的生物信息學和計算生物學的結(jié)合也催生了生物醫(yī)學的新機構(gòu)形式和新市場。以統(tǒng)計為動力的「數(shù)據(jù)驅(qū)動生物學」已經(jīng)配置了一種新興的醫(yī)學——工業(yè)綜合體,有望實現(xiàn)個性化和“精確”形式的診斷和治療。
將個體的基因型與參考數(shù)據(jù)進行比較的算法流水線會產(chǎn)生一系列有關(guān)未來健康和風險的預測。同時,人們一直擔心基因組數(shù)據(jù)信息的收集會暴露太多我們的個人信息,讓我們面臨新的歧視。
(來源:Pexels)
精準醫(yī)學的價值和負擔能力
精準醫(yī)學用遺傳信息來對人體疾病進行預防干預。通常我們關(guān)心的是能否負擔得起這項技術(shù)的費用,但很少關(guān)注它的價值。其價值可以通過為干預措施每花費1美元所獲得的健康結(jié)果來衡量。
理想情況下,精準醫(yī)學干預既可以節(jié)省成本,又可以改善結(jié)果。但大多數(shù)醫(yī)療保健干預措施都是以更高的成本來產(chǎn)生更好的結(jié)果,精準醫(yī)學也是如此。
如何解決精準醫(yī)學的價值和可負擔性之間的矛盾,需要進一步討論和推進。
找到精準醫(yī)學產(chǎn)生的價值和可負擔性之間的關(guān)系,需要有關(guān)總成本和成果以及潛在成本抵消的數(shù)據(jù),但這些數(shù)據(jù)很難捕獲。因為成本通常是預先發(fā)生的,隨著時間的推移逐漸產(chǎn)生有益的成果。
新興的精準醫(yī)學檢測可用于篩查大量人群,包括對所有新生兒進行基因組測序、液體活檢以篩查常規(guī)初級保健就診的癌癥和成人阿爾茨海默病的預測性檢測。這些干預措施可能會帶來巨大的好處,但可能需要大量的前期支出。
雖然現(xiàn)在已經(jīng)開發(fā)出各種方法來整合可負擔性和價值,但是成本效益分析通常不檢查預算影響,這可能導致不完整或矛盾的結(jié)論。對可負擔性和價值的越來越多的考慮,不是方法論進步的結(jié)果,而是更多地關(guān)注如何確保可持續(xù)和有效的醫(yī)療保健。
這樣做的積極結(jié)果是,在現(xiàn)有數(shù)據(jù)的基礎(chǔ)上更好的定義和量化負擔能力和價值的研究。大多數(shù)技術(shù)只有價格合理且具有高價值,才能發(fā)揮其潛力。
(來源:RENEBEGAY)
應結(jié)束種族與遺傳學的糾纏
人類基因組工作草圖的首次出版后,研究人員證實了許多學者們幾十年來的認識:種族比賽是一種社會結(jié)構(gòu),而不是寫在我們的基因里。
然而,人類基因組圖譜的出現(xiàn)并沒有讓這種比賽停止,而是引起了人們對基于種族遺傳差異的新興趣。
在白人至上主義者網(wǎng)站上發(fā)布的最新遺傳研究成果,導致美國人類遺傳學會在2018年發(fā)表了另一條聲明,譴責基于遺傳學的種族純度主張「在科學上毫無意義」。這些歷史都沒有限制對種族之間遺傳差異的搜索以及對各種種族差異的遺傳解釋,這反過來又引起公眾對種族和遺傳的持續(xù)困惑。
現(xiàn)在是時候結(jié)束種族與遺傳的糾纏了,努力對人類的統(tǒng)一與多樣性有全新的認識。一般有兩種方法可以幫助指導創(chuàng)新的研究問題和方法,這些問題和方法不再像人類生物學那樣依賴種族分類。
第一,遺傳研究人員應停止使用種族作為可解釋健康、疾病或?qū)χ委煼磻町惖纳飳W變量。將種族視為生物危險因素,掩蓋了結(jié)構(gòu)種族主義如何產(chǎn)生生物影響并在種族化的人群中造成健康差異的。
研究人員必須謹慎行事,以免使有害的表觀遺傳過程看起來像是永久的和不可避免的,應將注意力從最初引起問題的結(jié)構(gòu)不平等問題上轉(zhuǎn)移開來。
第二,研究人員應停止使用人類基因的白色歐洲標準,而應研究更廣泛的人類遺傳變異。例如,一直研究非洲大陸各族群的DNA擴展遺傳數(shù)據(jù)庫的項目表明,這些種群是地球上遺傳多樣性最豐富的種群,并且駁斥了存在遺傳上可區(qū)分的黑人種族的謬論。
多樣化生物醫(yī)學研究的目的不應只是發(fā)現(xiàn)種族群體之間的先天遺傳差異,而是應該使來自不同種族群體的人們有平等機會參與高質(zhì)量的研究、倫理研究(包括臨床試驗)并分享收益,并為科學家提供豐富的資源以更好地了解人類生物學。
通過這種方式,基因研究可以促進更多的個性化診斷和治療,而不再依賴于基于患者種族的粗略醫(yī)學決定。
(來源:Pexels)
后疫情時代的遺傳隱私問題
2007年,只有Craig Venter和Jim Watson兩個人的全基因組測序完畢。如今,超過3000萬個人可以訪問其詳細的基因組數(shù)據(jù)集。基因組數(shù)據(jù)的民主化有助于家庭團聚,反對種族主義,促進遺傳素質(zhì),但也使得被監(jiān)控的范圍更大。
遠親之間DNA變異的相關(guān)性可以讓相對較小的數(shù)據(jù)庫能識別大部分人口,即使這個人的數(shù)據(jù)不在數(shù)據(jù)庫中。隨著消費者基因組學和允許參與者上傳基因組數(shù)據(jù)的第三方網(wǎng)站出現(xiàn),收集和訪問DNA數(shù)據(jù)變得越來越容易。
我們認為,新冠疫情的爆發(fā)會加速基因監(jiān)測。人們可能會在到達邊境的機場中接受監(jiān)測。機構(gòu)可以利用疫情控制基礎(chǔ)設(shè)施來建立所有入境者的DNA數(shù)據(jù)庫,這樣的數(shù)據(jù)庫通過家族聯(lián)系放大遺傳信息,可識別入境者本國很大一部分人口遺傳信息。
隨著第三方基因數(shù)據(jù)庫規(guī)模的擴大,基本上每個具有適當技術(shù)技能的人都能夠識別個人遺傳信息。所以我們還需要建立有關(guān)基因監(jiān)測技術(shù)的使用指南。公開的討論對進一步制定政策,利用基因組革命的力量造福公眾至關(guān)重要。
(來源:Pexels)
本土基因組學中的新興倫理
盡管在過去的二十年中,基因組學研究取得了長足進步,但部分當?shù)卦∶窨峙虏⒉贿@么認為。在很多已經(jīng)收集了原住民的生物材料來研究疾病、醫(yī)學特征和人口起源的研究中,許多研究并未使參與者或其社區(qū)受益,一些研究甚至造成了損害,例如加劇了歧視和有害的偏見或?qū)ξ幕叛龅奶魬?zhàn)。
原住民可能無法從精準醫(yī)學和藥物基因組學等領(lǐng)域的研究中受益,并且健康差異可能仍未得到解決。目前原住民學者正在制定指導方針,以解決這些問題,希望研究能讓當?shù)卦∶袢嗣竦臋?quán)益更公平,對其社區(qū)更加有益。
對原住民的權(quán)利和利益更多關(guān)注并增強其參與程度和能力,有可能減少偏見并為所有人提供更多相關(guān)和有益的研究。
(來源:Pexels)
多元化世界中的多基因風險
多基因風險評分(PRS)是一種將一個人的基因組中多個多態(tài)性的微小影響匯總到一個評分中的系統(tǒng),可以通過獲得等位基因全范圍關(guān)聯(lián)數(shù)據(jù)的任何表型來計算PRS。
在醫(yī)學和公共衛(wèi)生中,PRS可用于選擇治療方法、啟動額外的風險篩查或促進行為改變。迄今為止,PRS已被證明在血壓、肥胖、糖尿病、抑郁癥、精神分裂癥和冠心病等疾病中具有一定作用。
PRS還可顯示基因組學中種族與祖先的復雜交集關(guān)系,補充先前工作的空白。最近的分析表明,在26項以前的研究中,減貧戰(zhàn)略顯著惡化的人主要是歐洲血統(tǒng),而沒有足夠的數(shù)據(jù)來評估其他地區(qū)群體的表現(xiàn)。
研究人員將此結(jié)果歸因于在開發(fā)PRS的數(shù)據(jù)集中非歐洲人和少數(shù)民族代表性不足。相比較大多數(shù)基因組數(shù)據(jù)集中包含的人,少數(shù)民族群體的祖先往往來自歐洲以外的地方。
為了讓PRS的不同預測能力更好,研究人員已經(jīng)開發(fā)了一些專門針對非洲血統(tǒng)的人的PRS,而基因組科學家正在考慮是否對「每個族群都需要特定于祖先的PRS」。
如果不考慮社會不平等如何影響健康,以及種族如何不完美地替代了祖先,那么對遺傳祖先對PRS的影響就很容易陷入對種族的不了解。社會需要多種學科的方法來為不同的群體開發(fā)和實施PRS。
否則,祖先特定的PRS可能會重新激起人們對種族作為遺傳上不同的群體的誤解,并鼓勵人們錯誤地認為種族群體之間的性狀分布主要是由遺傳引起的。這種信念對于白人至上和種族主義醫(yī)學實踐至關(guān)重要。
科學中的不公正可能會因為不包括某些人群而發(fā)生,但不公正的包容也會導致不公正。
(來源:Pexels)
基因組監(jiān)測的風險以及如何阻止
雖然在部分案件中,使用DNA譜分析有助于識別嫌疑人并釋放無辜者。但在過去二十年來,全球范圍內(nèi)將人類遺傳信息以國家DNA數(shù)據(jù)庫的形式保存現(xiàn)象激增,這引發(fā)了重要的人權(quán)問題。
歐洲和美國的地標法院判決對DNA數(shù)據(jù)的收集和保留設(shè)置了一些限制,但這些決定遠非我們需要的全面法規(guī)。
隱私權(quán)是基本人權(quán)。在世界范圍內(nèi),DNA的不受監(jiān)管的收集、使用和保留已成為基因組監(jiān)測的一種形式。
隨著檢測技術(shù)的價格越來越低,監(jiān)測的采用變得越來越廣泛,基因組監(jiān)視的巨大風險也隨之產(chǎn)生。各國政府應改革監(jiān)督法并起草全面的隱私保護措施,以嚴格監(jiān)管DNA和其他生物識別符的收集、使用和保留。
如果他們不符合合法性、相稱性和必要性的國際人權(quán)標準,則應禁止此類活動。
(來源:Pexels)
原文鏈接:https://science.sciencemag.org/content/371/6529/564
(聲明:本文僅代表作者觀點,不代表新浪網(wǎng)立場。)