tft每日頭條

 > 健康

 > 智因東方速遞兒科基因組學

智因東方速遞兒科基因組學

健康 更新时间:2024-07-22 03:11:36

點擊上方“轉化醫學網”訂閱我們!

幹貨 | 靠譜 | 實用

智因東方速遞兒科基因組學(智因東方速遞兒科基因組學)1

導 讀

昨天的推送中論述了傳統的基因診斷檢測、全外顯子測序(WES)或全基因組測序(WGS)在目前臨床上應用的主要适應症以及兒科基因組學的發展。今天這篇文章主要介紹兒科基因組學的數據整合和解讀。

數據的整合和解讀

在過去的十年中,越來越清楚的是,個體基因組的信息不能單獨被解析。需要了解群體中出現的背景變異以過濾常見變異。理想情況下,這些信息來自随機抽樣的個體,并且這些個體沒有通過任何特定的臨床或社會特征來進行選擇,需要成千上萬個這樣的基因組,對變異進行提取、注釋和解讀。最佳的變異分類,還需要檢測個體詳細而全面的臨床信息,而不是簡單的診斷标簽。WES和WGS數據量之大,需要自動化的變異過濾,從而可以集中處理與臨床相關的基因組區間和/或變異特征。 用于診斷罕見病的分析工作流程尚未完全标準化,因為實現強大基因診斷的工作流程環節包括原始數據的處理、緻病性變異的識别、臨床數據的整合等 (FIG. 3),是非常複雜的且仍在不斷發展完善中,且因為每一步都有其自身的問題需要進行個體化的評估。

1

變異的提取和注釋

變異的提取和注釋涉及高度複雜的過程,使用同一流程對同一WGS樣品進行重複分析,其重複性一般小于100%。 變異提取通過将數據中表示的每個位置與參考基因組中的等同位置進行比較,從而識别出個體等位基因堿基組成的差異。提取的靈敏度取決于檢測數據和參考數據的質量及所采用的算法。低質量或低覆蓋率的數據會導緻輸出結果中重要變異的丢失。在重複序列中進行變異提取是非常難的,尤其是對小的插入缺失,這也會導緻錯誤的診斷,盡管變異提取過程發生在原始數據處理階段。變異提取數據通常保存在标準化的VCF(Variant Call Format,VCF) 文件中,該文件通常被修改包括對每個變異進行注釋以用于臨床分析。一些注釋對于臨床解讀來說是非常關鍵的,尤其是次要等位基因頻率(Minor Allele Frequencies,MAFs)和變異危害性預測。所有的注釋,除了MAF數據, 都會随着注釋時所使用的數據和軟件工具而變化。因此,盡管具有标準化的結構,來自相同的數據的VCF文件在不同的提供者和不同的版本之間會有很大的差異。

Box 1|兒科基因組學的倫理、法律和社會影響

兒科基因組學同樣存在臨床遺傳學幾十年來一直面對的許多倫理、法律和社會問題,例如對生殖自主權、科研項目的知情權、雙親關系的隐私以及對家庭成員的影響。然而,基因組數據量的巨大和廣度還帶來基因檢測本身的新問題,這對兒科檢測來說更為複雜;兒童缺少是否接受檢測和/或研究的自主權,這意味着在決定什麼最符合患兒的利益方面,父母和臨床醫生起到更重大的作用。基因組學時代的絕大多數新倫理問題都與數據的存儲、解讀和使用有關。

數據存儲

由于臨床級别下一代測序(NGS)數據的大小,及對其分析所需的計算能力,應該如何以及在何處存儲這些數據尚不清楚。此外,不清楚誰可以利用,或是什麼時候應該允許利用這些數據。例如,醫療記錄是應該僅包含用于診斷的變異,或是所有潛在的臨床相關變異,或是所有檢測到的變異,還是應該包含全外顯子組或全基因組序列?若是親代基因組已經作為Trios家系策略的一部分進行了測序,那麼家系數據應該如何以及在何處存儲?數據訪問是應該隻限于參與直接服務于該家庭的臨床醫生,或也向工業界和/或學術界的研究人員開放?盡管具有基因組序列的個體在未來幾年内可能在數據重複分析中獲得臨床益處,但是不斷發展的測序技術可能意味着,如果臨床指征明确,那麼簡單利用新的測序技術對其基因組進行重新測序,可能比起數據存儲來說實際上更便宜、更簡易且更具臨床應用的信息價值。

數據的保密性與利用

NGS檢測得到初步結果後,必須要在保護患者個體隐私和廣泛數據分享以完善變異解讀(為了患者個人或其他患者的利益)之間進行微妙地平衡。在兒科中,這種平衡更加複雜,父母經常被要求對孩子的基因數據做出決定,而這可能會造成不可逆轉的影響。當孩子接近或超過法定年齡時,這些決定是否應被重新審視?關于誰能訪問這些數據的問題,不僅涉及到諸如家庭成員、臨床醫生和研究人員等個人,還涉及到他們可獲得數據的範圍。問卷數據表明,父母對數據分享未來對他們的孩子帶來風險的問題上,比成年患者更為關心。對數據的使用權限,可能限于特定診斷的基因變異,或是一系列臨床相關的結果,也可能包括整個測序序列。對此,我們在之前提出過一種平衡數據深度和共享範圍的比例方法。這種方法包括完全公開共享有限數量的潛在緻病變異,從而最大限度地發揮診斷的潛在益處,同時最小化個體可能被重識别的風險。盡管共享個體全外顯子組或全基因組數據也很重要,但個人被重識别的可能性要高得多,因此實際中經常使用具有嚴格管理訪問權限的數據庫來管理數據。共享匿名且有限的表型和基因型數據,不僅可以增加診斷和新發現的機會,而且還将增加極罕見病情的患者參與到新療法的研究或臨床試驗的機會。

醫療服務的責任

對于臨床醫生來說,數據的訪問問題與他們的醫療職責是否僅限于為患兒的直接問題進行診斷,或是否超出了初始檢查的範圍有關。這項醫療責任可以延伸到當新知識被揭示出來時,定期對數據進行再分析,有可能在最初測序的多年後才能對患者進行确診,或者根據新證據來糾正之前的誤診。一些研究已經開創了一種定期更新基因panel進行疊代報告的方法,基于目前發現新基因的速度,這或許在兒科中産生實質性的診斷獲益,盡管如此,但在臨床中對基因組數據進行常規重新分析卻受阻于用于更新和重新分析數據的資源不足以及需重新聯系患者等情況。

醫療服務的職責還可以擴大到尋找傾向于成年發病的情況以及患兒及父母的不良藥物反應的偶然發現。美國醫學遺傳學和基因組學協會推薦,應在檢測數據中積極查詢額外的“looked-for”的發現,盡管目前僅限于59個基因的緻病變異。一般情況下,不建議對兒童進行無早期治療的成人發病的疾病的額外查詢,迄今為止,英國和歐洲的遺傳學會一直在試圖擴大基因組分析的範圍,而非僅僅是尋求診斷。遺憾的是,解釋無症狀家族中可能的緻病變異通常是困難的,因為大多數疾病基因已經在具有特定病症的個體或家系中被發現;因此,機會性基因組篩查(opportunistic genome screening)的益處和危害目前還不清楚。

智因東方速遞兒科基因組學(智因東方速遞兒科基因組學)2

Figure 3 | 運用二代測序技術,整合臨床和實驗室的工作流程,用以優化罕見病的診斷。

兒科基因組學服務的安全、有效的實施,需要精心的設計,以優化臨床醫師、生物信息學家以及科學家在診斷流程中各個部分的專業建議。變異篩選過程的每個步驟都必須謹慎考慮和充分評估,因為緻病變異可能在任何步驟被疏忽篩除。盡管如此,仍需要嚴格的篩選使變異數量降到足夠低的數量以供專家審核。通常次要等位基因頻率MAF>1%或甚至>0.1%的變異會被篩除。需注意的是以下可能造成緻病變異丢失的情況:選擇了錯誤的基因轉錄本,在trios家系分析中誤判了遺傳模式(比如,表型輕微的父母被記錄為表型正常),或者造成罕見病的變異類型在測序中或在檢測流程中未能很好的捕獲和檢測(例如三堿基重複變異導緻的疾病,如脆性X綜合征)。

對患者的臨床評估發生在診斷的開始和結束。在開始階段,臨床評估用于确定患者的臨床表現存在可檢測的遺傳基礎的先驗可能性,以及用于确定臨床表型和建立臨床鑒别診斷。最後,臨床醫師應當評估實驗室所提交的候選變異,能否構成明确的遺傳病診斷(完整的或部分的診斷),以及診斷是否足夠可信,得以指導患者未來的臨床診療,并指導其親屬檢測或胚胎植入前檢測和産前診斷。在一些疑難病例中,罕見的候選變異常由臨床專家和遺傳專家組成的多學科小組會診予以讨論(見FIG. 3)。ACMG,美國醫學遺傳學與基因組學學會;HPO,人類表型本體。(譯者注:圖示将流程劃分為實驗室和臨床兩部分,并且這二者是有機聯系的,尤其是實驗室需要基于臨床表型信息進行分析,臨床醫生需要對基因數據結合臨床進行評估。目前國内已有面向醫生的診斷雲平台系統,醫生得以參與到檢測報告數據的審核以及與實驗室的互動溝通)

2

變異的過濾

關于将哪些變異納入到診斷評估體系,哪些變異從後續分析中排除,在很大程度上取決于所使用的資源和訪問日期。如果變異沒有預測性的或已知的功能改變,或是被認為是太常見而不能成為特定疾病的原因,或者因為它們不符合所觀察到的疾病的遺傳模式,則這些變異通常會被排除(FIG. 3)。如果使用Trios模式, 則在對父母進行表型評估時需留意,以确保他們沒有與患兒疾病相關的輕微的亞臨床表型,否則會指向錯誤的遺傳模式,從而混淆分析。過濾掉不具有已知功能的變異需要通過諸如Ensembl VEP 或 SNPeff 的軟件準确預測基因變異的危害性影響。但是,這些預測可能并不能反映一個變異的真實的生物學危害性意義。此外,由于存在可變剪切體,相同的基因組變異可能具有不同的預測性結果,且缺乏一種簡單的選擇方法來确定大多數基因的臨床相關轉錄本,這是不同診斷實驗室之間差異的重要來源。識别常見變異需要訪問具有大規模的人群資源數據信息的數據庫,如ExAC數據庫和gnomAD數據庫。

在撰寫該綜述之際,這些數據庫已包含了來自一系列成人研究隊列的超過12 萬個外顯子組和15,000個基因組的變異數據,盡管許多種族人群數量仍然不足。導緻嚴重兒童疾病的基因變異很少出現在成人疾病群體或其對照組的緻病構型中,并且對早發型疾病來說,生活方式因素和長期的環境暴露不太可能導緻其實質性的疾病多變性。因此,可以使用非常嚴格的等位基因頻率阈值來篩選非常罕見的變異,用于患兒變異數據的進一步分析。然而,測序個體的種族以及其種族在參考數據庫中的代表數據收錄的情況,可能會影響變異過濾的有效性,且在基因組分析中仍然存在着歐洲偏倚(European bias)。

智因東方速遞兒科基因組學(智因東方速遞兒科基因組學)3

Figure 4 |基于表型的變異評級和解讀的多學科小組評審。

兩種互補的方法(臨床和統計學)可用于基于表型的變異評級。 a | 臨床方法中,經過變異緻病性、人群中出現的頻率和遺傳方式進行篩選後保留下來的變異,應參考患兒的臨床表型來進行評估(譯者注:即為生物、遺傳、臨床三要素分析)。這項工作最好在多學科專家小組的協助下進行,專家組對患者的臨床表現、家族史、相關病史和其他檢查結果(比如生化檢查和影像結果)進行回顧,參考某個特定基因相關的臨床特征的可用彙總數據(如 FIG. 4b) 和已報道的文獻。分子診斷提示的候選結果可能需要新的數據(比如家系分析、進一步的臨床檢查或者對患兒信息的重新調研)來确定結論和進行可靠的基因診斷,或排除一個無法解釋患者表型或家系遺傳方式的基因變異結果。在部分患者中,變異是否緻病并不能得到明确的結論。b | 表型匹配的統計學方法需要一定數量的在同一基因上存在緻病變異的其他個體和目标患兒的分類的、定量的和/或基于影像的表型信息。這些數據可以用統計學方法對患兒表型與疾病模型匹配進行量化,并與其他不相關疾病的模型匹配進行比較分析。随着被基因診斷确診的罕見和極罕見遺傳病的患兒越來越多,這個方法将越來越可行。BWt,身體體重;DQ,發育指标;HPO,人類表型本體;Ht,身高;OFC,枕額周長/頭圍;Wt,體重。(譯者注:BWt應為出生體重,Birthweight。應為原文錯誤)

3

緻病性判斷

臨床檢查是否全面詳盡,對于解讀基因組測序鑒定出的候選變異和保持良好的臨床實踐仍然是至關重要的(FIGS 3,4)。 對自動化流程篩選出的罕見變異進行緻病性判斷和确定基因診斷,是極具挑戰性的。以往與所述疾病有關的基因變異通常通過設定基因panel進行優先考慮,并且鑒定出由非衆所周知的緻病病因導緻的患者,有助于鑒定新的緻病原因。

然而不幸的是,文獻中常常出現假的基因-疾病關聯關系,這導緻了基因panel之間的巨大差異,而且關于依據何種證據水平将某個基因納入一個基因panel中,尚缺乏明确的共識。此外,用于臨床的緻病性變異數據庫,如Human Gene Mutation Database(HGMD),裡面有大量錯誤,導緻很多良性變異被錯誤的選中而形成貌似可信的診斷。随着基因組測序數據的增長,這種情形有可能會得到改善,但像gnomAD和ClinVar這類包含健康人群及罕見病人群的基因組大數據集,其重要性是不應被過度誇大的。兒科的大型隊列研究,例如英國破譯發育障礙性疾病的研究(Deciphering Developmental Disorders Study inthe UK),從統計學意義上建立了僅基于基因組數據判斷緻病性的可靠方法。該研究同時也參考了表型數據的分類和定量。分類方法使用結構化的分類法,例如人類表型本體(the Human Phenotype Ontology, HPO), 用以獲得重要的臨床特征,同時兒科遺傳學的量化數據則包括生長發育關鍵節點的數據。

美國醫學遺傳學和基因組學學會-分子病理學協會(AmericanCollege of Medical Genetics and Genomics-Association for MolecularPathology, ACMG-AMP)指南 的出版是朝着建立變異分類的通用框架邁出的重要一步,且這一框架将持續被完善。DECIPHER之類的平台幫助臨床醫生進行标準化表型的捕獲,并将其與基因型整合為單一資源内的患者級數據記錄,從而能夠對相關數據進行全面的探索分析。DECIPHER顯示表型信息、成像數據、基因型信息(包括變異型,如SNV或CNV,危害性和遺傳模式)以及2D/3D蛋白質結構(如果有的話),參考文獻及種群信息等。它以ACMG變異緻病性變異分類支持作為補充,并作為一種補充性的評估工具,促進基于分子和臨床專業知識整合的多學科團隊決策,從而實現可靠的基因診斷。系統性地捕獲罕見和極罕見遺傳病的患兒個體的分類和定量表型數據,也将有助于促進利用統計學方法來确定每種疾病的識别模式。這将使得在(曆史數據中,譯者注)已檢測過的個體中所觀察到的表型,與(當下案例中,譯者注)由基因檢測所産生的每種疑似緻病基因型相關的所預期的表型之間,進行表型相似度的可靠的評估成為可能(FIG. 4b)。

4

數據共享

基因組數據的解讀高度依賴于對對照群體和患者群體變異數據庫的運用。然而,廣泛的數據共享将面臨後台維護的挑戰——因其絕對龐大的數據量,和倫理方面的挑戰——緣于不可能将基因組序列數據真正匿名化(BOX 1)。 通過DECIPHER 和 Phenome Central等資源共享組織化的或疑似表型變異的關聯将促進這一進程,并最大限度地減少每個人共享的變異數量。諸如GA4GH Matchmaker Exchange 之類的舉措,将這些數據與其他資源如(GeneMatcher) 聯合起來,從而增加了搜索範圍。ACMG最近發表了立場聲明,即實驗室和臨床基因組的數據共享,對于改善遺傳醫療保健至關重要。WES和WGS技術使我們能夠在已知知識範圍内進行罕見病的基因診斷,并可以通過仔細閱讀當前的文獻,掌握适當的注釋平台和知識庫的工作知識,以及與研究工作進行對接等方式加以不斷鞏固。理想狀态下,這個框架應該由一個協作的基礎設施來補充,以支持功能化和模式生物研究,從而帶來更廣泛的專業知識來實現可靠的分子和臨床診斷。

關于兒科基因組學:在兒童罕見病診斷中的應用的後續内容更加精彩,請繼續關注明日轉化醫學網……

智因東方速遞兒科基因組學(智因東方速遞兒科基因組學)4

轉化醫學領域核心門戶

識别圖中二維碼,點擊關注

投稿、應聘醫學編輯:

vipmed360

商務合作

zhyxkf

END

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关健康资讯推荐

热门健康资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved