當前位置:律師網大全 - 專利申請 - 如何根據基因測序分析結果找到通路

如何根據基因測序分析結果找到通路

動植物基因組De?新測序分析(Novo sequencing analysis)又稱從頭測序分析(de novo sequencing analysis),是指在沒有任何參考序列信息的情況下,對壹種動植物進行測序,利用最新的生物信息學方法獲得壹個物種的基因組序列圖譜,並進行基因組結構註釋、功能註釋、比較基因組學分析等壹系列後續分析。第三代測序技術(以PacBio和納米孔為代表)具有長閱讀的特點,自2015在動植物基因組從頭開始使用。這類測序分析的結果可廣泛用於農業、林業、漁業、畜牧業、醫學和海洋的研究。

圖1不同測序技術的閱讀長度、準確性和基因組連續性評估

三代測序技術原理

PacBio測序原理

采用邊合成邊測序的方法,以其中壹條DNA鏈為模板,用DNA聚合酶合成另壹條鏈,熒光信號進壹步轉化為堿基信號。同時,PacBio對CCS測序模式進行了升級,獲得了長閱讀長度的高保真(HiFi)15 kb閱讀,從而提高了基因組組裝的準確性。

圖2三代PacBio測序原理

納米孔測序原理

當單鏈DNA分子通過納米孔時,每個核苷酸將獲得不同的電流信號。記錄每個孔中離子電流的變化,並轉換成基於馬爾可夫模型或遞歸神經網絡的基序列。此外,超長閱讀(ULRs)是ONT平臺的另壹個重要特征,並具有促進大基因組組裝的潛力。

信息分析內容

德?Novo研究內容

基因組拼接的多軟件拼接及拼接結果的評價

基因預測和註釋編碼基因預測;重復序列註釋和轉座組件分類;非編碼RNA註釋;假基因註釋等。

Hi-C輔助基因組組裝有效數據評估;重疊群聚類、排序和方向分析;貼裝結果評估

生物學問題分析

比較基因組學研究

基因家族聚類;

系統進化樹的構建;

基因家族擴張和收縮的分析;

物種分化時間的計算;

LTR形成時間的估計;

全基因組復制事件;

選擇性壓力分析

具體生物問題的分析結合組學研究方法,深入分析壹個物種的生物問題。

草莓基因家族的聚類分析

薏苡全基因組復制事件分析

阿月渾子的系統進化樹和基因家族收縮與擴張分析。

陸地棉亞基因組的線性分析

技術服務流程

樣品交付

數據庫構建排序

數據分析

發布報告

售後問題解答

產品優勢

公司成立於2009年,深耕基因組測序領域11年,長期致力於成為精準的基因組組裝專家;

擁有全球最主流的三代測序平臺(PacBio測序平臺和納米孔測序平臺),擁有數萬個物種的雙平臺組裝和基因組組裝的豐富經驗。

Hi-C染色質構象捕獲技術庫有效數據比例高,掛載效率高達99%。憑借豐富的多倍體物種研究經驗,結合第三代基因組組裝獲得染色體水平基因組的同事進壹步提高了基因組組裝的質量。

憑借自主研發的領先的基因組測序和分析技術,獲得了23項發明專利和超過150項核心軟件著作權。

項目經驗示例

合作條款案例

案例1

基於更新的亞洲棉A基因組對243份二倍體棉花重要農藝性狀的研究

243份二倍體棉花材料的再測序?基於更新的基因組識別關鍵農藝性狀的遺傳基礎

期刊:自然遺傳學

影響因子:27.125

發布單位:中國農業科學院棉花研究所、北京百邁克生物科技有限公司等。

出版年份:2065438+2008年5月

研究背景:

棉花是研究植物多倍體的寶貴資源。亞洲棉和草本棉的祖先是現代異源四倍體棉花亞基因組的供體。本研究利用三代PacBio和Hi-C技術重新組裝了高品質亞洲棉基因組,分析了243份二倍體棉花種質的群體結構和基因組分化趨勢,確定了壹些有助於棉花皮棉產量遺傳改良的候選基因位點。

研究結果:

1,亞洲棉第三代基因組組裝;

亞洲棉的基因組組裝是結合三代測序進行的,Hi-C * * *獲得142.54 Gb,組裝出1.71 Gb亞洲棉基因組,重疊群N50=1.1 Mb,最長的重疊群為12.37 Mb。利用Hi-C技術將1573 Mb的組裝數據定位到13條染色體上。與已發表的基因組相比,當Hi-C數據與更新後的基因組比較時,非對角不壹致性明顯減少(圖1 a-b)。

圖1亞洲棉花基因組兩個版本的HI-C數據比較

2.二倍體棉花群體的遺傳進化分析;

對230份亞洲棉花和13份棉草進行了重新測序。基因組比較、系統進化樹、群體結構分析、PCA、LD和選擇性清除分析表明,亞洲棉和棉草(a)與雷蒙棉同時分化。亞洲棉花起源於中國南方,然後傳入長江和黃河流域。大多數具有馴化相關特征的種質經歷了地理隔離(圖2)。

圖2二倍體棉花的群體進化和群體結構分析

3.亞洲棉花全基因組關聯研究(GWAS):

對來自不同環境的11重要性狀進行全基因組關聯研究分析,鑒定出亞洲棉11重要農藝性狀的98個顯著相關位點。GaKASIII的同義替換(半胱氨酸/精氨酸替換)導致棉籽中的脂肪酸組成(C16:0和C16)。發現棉花枯萎病抗性與GaGSTF9基因表達的激活有關。選取亞洲棉花種質中的158份皮棉和57份無皮棉材料進行GWAS相關分析,發現了與表皮毛和纖維發育相關的信息(圖3)。

二倍體棉花的群體進化和結構分析。

研究結論:

通過三代測序+Hi-C技術完成了亞洲棉的基因組重組,基因組組裝指數從72?Kb增加到1.1 Mb,為後續亞洲棉的群體遺傳學等相關研究奠定了基礎。通過群體遺傳進化的相關性分析,發現亞洲棉和草棉(A型)與雷蒙棉(D型)同時分化,證明亞洲棉起源於中國南方,傳入長江和黃河流域。通過整合GWAS和QTL分析方法,定位了亞洲棉脂肪酸含量、抗病性和皮棉生長發育相關基因並驗證了其相關功能,促進了亞洲棉復雜農藝性狀的改良。

案例二,

二倍體、野生和栽培四倍體花生的比較基因組分析揭示了亞基因組的不對稱進化和改進。

花生的比較?二倍體和培育的四倍體基因組?揭示花生不對稱亞基因組進化和改良

期刊:高級科學

影響因子:15.804

發布單位:河南農業大學、北京百邁克生物科技有限公司

出版年份:2019 11。

研究背景:

花生作為我國重要的經濟作物,是提供重要蛋白質和油脂的基礎。花生屬包括30個二倍體品種,1異源四倍體野生花生(花生)和1栽培花生(花生)。野生四倍體花生作為改良栽培花生農藝性狀的重要野生資源供體,壹直是國內外學者的研究熱點。對花生屬唯壹的野生異源四倍體花生進行了基因組研究。

  • 上一篇:情緒表達,情緒發泄,情緒發泄
  • 下一篇:商標侵權訴訟需要哪些證據
  • copyright 2024律師網大全