基因組重測序的應(yīng)用
一、背景
基因組重測序是對已知基因組序列的物種進(jìn)行不同個體的基因組測序,并在此基礎(chǔ)上對個體或群體進(jìn)行差異性分析。
全基因組重測序的個體,通過序列比對,可以找到大量的單核苷酸多態(tài)性位點(SNP),插入缺失位點(InDel,Insertion/Deletion)、結(jié)構(gòu)變異位點(SV,Structure Variation)位點和拷貝數(shù)變異位點(CNV,copy number variation)。SBC可以協(xié)助客戶,通過生物信息手段,分析不同個體基因組間的結(jié)構(gòu)差異,同時完成注釋。
技術(shù)路線:提取基因組DNA,利用Covaris進(jìn)行隨機(jī)打斷,電泳回收所需長度的DNA片段(0.2~5Kb),加上接頭,進(jìn)行cluster制備(Solexa)或E-PCR(SOLiD),最后利用Paired-End(Solexa)或者M(jìn)ate-Pair(SOLiD)的方法對插入片段進(jìn)行重測序。
二、生物信息分析流程
1、數(shù)據(jù)量產(chǎn)出
總堿基數(shù)量、Totally mapped reads、Uniquely mapped reads統(tǒng)計,測序深度分析。
2、一致性序列組裝
與參考基因組序列(Reference genome sequence)的比對分析,利用貝葉斯統(tǒng)計模型檢測出每個堿基位點的最大可能性基因型,并組裝出該個體基因組的一致序列。
3、SNP檢測及在基因組中的分布
提取全基因組中所有多態(tài)性位點,結(jié)合質(zhì)量值、測序深度、重復(fù)性等因素作進(jìn)一步的過濾篩選,最終得到可信度高的SNP數(shù)據(jù)集。并根據(jù)參考基因組序列對檢測到的變異進(jìn)行注釋。
4、InDel檢測及在基因組的分布
在進(jìn)行mapping的過程中,進(jìn)行容Gap的比對并檢測可信的Short InDel。在檢測過程中,Gap的長度為1~5個堿基。
5、Structure Variation檢測及在基因組中的分布
目前SBC能夠檢測到的結(jié)構(gòu)變異類型主要有:插入、缺失、復(fù)制、倒位、易位等。根據(jù)測序個體序列與參考基因組序列比對分析結(jié)果,檢測全基因組水平的結(jié)構(gòu)變異并對檢測到的變異進(jìn)進(jìn)行注釋。
三、應(yīng)用
用于應(yīng)用全基因組重測序技術(shù)篩查原發(fā)性肌張力障礙的致病基因研究:
應(yīng)用全基因組重測序技術(shù)對原發(fā)性肌張力障礙病患者進(jìn)行全基因組重測序,結(jié)合生物信息學(xué)技術(shù),篩查出可能與原發(fā)性肌張力表型患者密切相關(guān)的基因突變位點,從而發(fā)現(xiàn)新的基因或突變,有助于我們對該疾病進(jìn)行正確的分子診斷以及提供更好的遺傳咨詢信息。
目的:(1)通過全基因組重測序技術(shù)篩查出可能與原發(fā)性肌張力表型患者密切相關(guān)的基因突變位點,為了該病家系患者的遺傳咨詢和臨床診斷提供依據(jù)。
(2)探討全基因組重測序技術(shù)在罕見疾病致病基因篩查應(yīng)用中的可行性,為該技術(shù)的臨床應(yīng)用提供新的信息。
方法:收集原發(fā)性肌張力患者及健康對照者外周血標(biāo)本及臨床資料,提取受試者基因組DNA,選取1例具有典型原發(fā)性肌張力表型患者的DNA和100例健康對照者DNA分別構(gòu)建患者全基因組測序文庫和健康對照者全基因組測序文庫,并進(jìn)行高通量測序。下機(jī)獲得原始數(shù)據(jù),經(jīng)過初步數(shù)據(jù)過濾后與標(biāo)準(zhǔn)基因組序列比對,獲得原發(fā)性肌張力表型患者及對照組基因變異信息;通過比較原發(fā)性肌張力表型患者及對照組基因變異信息,并結(jié)合生物信息學(xué)技術(shù),篩查可能與原發(fā)性肌張力表型患者密切相關(guān)的基因突變位點。
結(jié)果:(1)通過全基因組重測序一共得到240G bp的數(shù)據(jù),其中患者的數(shù)據(jù)產(chǎn)出為127.90G bp,原始數(shù)據(jù)測序深度為45X,有效測序深度為40.30X,基因組覆蓋比例為98.90%,SNP數(shù)量為3,602,141,Indel數(shù)量為58,127,CNV數(shù)量為831,SV數(shù)量為8,431;健康對照者的數(shù)據(jù)產(chǎn)出為112.91G bp,原始數(shù)據(jù)測序深度為40X,有效測序深度為35.70X,基因組覆蓋比例為99.50%,SNP數(shù)量為3,550,305,Indel數(shù)量為558,038,CNV數(shù)量為824,SV數(shù)量為8222。
(2)SNP公共數(shù)據(jù)庫過濾并將病人與健康對照對比后,得到96個突變位點,突變基因包括錯義突變,蛋白質(zhì)提前終止,移碼突變,內(nèi)含子剪切異常等多種類型。
結(jié)論:(1)在臨床應(yīng)用全基因組重測序工作中,患者結(jié)合健康人群的對照分析,有利于濾過未明確臨床意義的基因組變異位點。
(2)發(fā)現(xiàn)ANO3(N294H)突變與疾病的表型密切相關(guān),可能是中國原發(fā)性肌張力障礙病患者的致病突變之一。
北京天優(yōu)福康生物科技有限公司
官網(wǎng):http://www.hhxyw.com/
服務(wù)熱線:400-860-6160
聯(lián)系電話/微信:13718308763
QQ:2136615612 3317607072
E-mail:Tianyoubzwz@163.com


