韩国免费A级作爱片无码_亚洲欧洲精品成人久久av18_亚洲国产成人AV毛片大全_成年人在线免费看的惊悚动作片_一级爽片_爱爱免费

English | 中文版 | 手機版 企業登錄 | 個人登錄 | 郵件訂閱
當前位置 > 首頁 > 技術文章 > 第二代高通量測序技術使用的DNA裝配工具

第二代高通量測序技術使用的DNA裝配工具

瀏覽次數:11959 發布日期:2010-8-16  來源:本站 僅供參考,謝絕轉載,否則責任自負

     第二代高通量測序儀實現了較廉價和快速的DNA測序方法,但是它們有一個共同的缺點即讀出序列(reads)太短,大約在幾十個bp到幾百個bp。與生物的染色體長度相比,這樣長度的reads給下一步的裝配工作帶來麻煩。看似種類繁多的生物界其實只使用4種核苷酸,分別為A,T,G,C。這意味著DNA序列中會有數量極為龐大的片段存在重復的序列。

     因此裝配過程中有時很難判斷短reads在原序列中的位置,reads A可以放到C,D,E等多個位點上,reads B看似可以放在D,G,H等位點上。這類的工作靠手工無法完成,需要使用計算機按照一定的規則和要求來裝配reads。
     下面介紹一些非設備生產廠商提供的裝配軟件和特點。
 
1.  軟件名:Cross_match,作者:Phil Green, Brent Ewing and David Gordon
     網址:http://www.phrap.org/phredphrapconsed.html
 
     CROSS_MATCH用于蛋白質和核酸的序列對照,使用Smith-Waterman-Gotoh算法。通過對遞歸關系的改進提高了運行效率。適用于1. 按照參照序列為reads排序。2. 比較由不同的方法得到的重疊群(contig)。3. 比較完成裝配后重疊群和粘粒(cosmid)的序列。
 
2.  軟件名:Exonerate ,作者:Guy S. Slater and Ewan Birney
     網址:http://www.ebi.ac.uk/~guy/exonerate
    
     采用啟發式漸進算法完成排序運算,避免了遍歷耗時長的缺點,同時也解決了啟發漸進算法難以執行的問題。
 
3.  軟件名:MAQ,作者:Heng Li
     網址:http://maq.sourceforge.net
 
     MAQ依照參照序列對reads快速裝配,推斷出包括SNPs、插入、刪除在內的各種變體。在排序階段,首先按照最低的錯配值(mismatch score)搜索無空隙的排列。為提高速度MAQ只采用在前28bp中最多存在2個錯配的reads。
     MAQ在設計時就考慮處理人類DNA序列的需要,對硬件要求低筆記本電腦就可以輕松運行。為了便于查看結果,MAQ同時提供一個基于OpenGL的瀏覽工具MAQview。
 
4.  軟件名:Mosaik,作者:Michael Strömberg and Gabor Marth
     網址:http://bioinformatics.bc.edu/marthlab/Mosaik
 
     MOSAIK能夠讀取范圍較廣的reads從幾十bp到上百bp,按照Smith-Waterman算法,依據模板產生有空隙的排列。另外,MOSAIK支持多線程運行,最多可有8個CPU。可以全面支持3大主流測序儀Roche 454, Illumina, AB SOLiD,試驗性地支持Helicos。
 
5.  軟件名:BWA,作者:Li H. and Durbin R
     網址:http://bio-bwa.sourceforge.net/
 
     Burrows-Wheeler Aligner (BWA)允許采用較長的參考序列,而排列相對較短的核苷酸序列。BWA執行2種算法BWA-Short和BWA-SW。BWA-Short適用于短于200bp的reads,后者適用于大約100kbp的長度。兩者均能排列出有空隙的序列,雖然BWA-SW也能工作于較短的reads,但是它的敏感度較低,反之亦然。
 
     DNA裝配工具種類繁多,以上介紹了幾種比較典型的。此外還有RMAP,SHRiMP,SOAP,SSAHA2,SXOligoSearch等等,限于文章的篇幅這里就不一一介紹了。
     那么如何選擇一種適合自己需要的軟件呢?涉及到以下幾種因素。
1.  系統運行時間,圖一是幾種軟件對不同長度reads排序的時間消耗。

圖一 By Bala et al

2.  系統硬件的要求,下圖是軟件消耗內存大小的比較。

圖二 (By Bala et al)
 
3.   準確度上的差異,比較結果見下圖。

圖三 (By Bala et al)
 
4.   是否能從事查找SNPs、SV等方面的工作。
5.   Solexa,454,SOLiD測序結果的輸出格式并不相同,注意有所區別。很少有一款軟件可以支持所有格式的。
 
     reads的裝配還牽涉到另一個至今未妥善解決的問題。我們把基因組的長序列打斷(shortgun method),因為不知道整條基因組序列是如何排列、如何區分來自不同染色體的reads。同時現有的技術又不允許一次測完整條基因組序列。必須按照一定的算法,使用計算機高速計算的能力把這些短序列組裝起來還原成原來的序列(de novo assembly)。
     因為沒有參照序列,很可能組裝后的序列與原序列大相徑庭。一種稱作為paired-end的序列測序方法給出具有固定間距的reads。如下:
It is a very long human genome, so much longer than E.Coli’s.
It i*****ery *****huma*****ome,*****uch *****r th*****Coli***
     一個聰明的辦法,卻沒解決所有的難題。因為基因組中含有大量的重復序列(repeats),多態性變異(Polymorphism),測序錯誤(Sequencing error),一條序列存在很多可能的路(圖論),或者回環等。見下圖。

針對這些問題,已取得較滿意結果的部分軟件如下:
1.    軟件名Edena,作者:David Hernandez et al
       網址:http://www.genomic.ch/edena
 
2.    軟件名SHARCGS,作者:Juliane Dohm et al.
       網址:http://sharcgs.molgen.mpg.de
 
3.    軟件名SSAKE,作者:René Warren et al.
       網址:http://www.bcgsc.ca/platform/bioinfo/software/ssake
 
4.    軟件名VCAKE,作者:William Jeck
       網址:http://sourceforge.net/projects/vcake
 
5.    軟件名Velvet,作者:Daniel Zerbino and Ewan Birney
       網址:http://www.ebi.ac.uk/%7Ezerbino/velvet
 
      目前看來能最終解決組裝問題的希望寄托在第三代高通量單分子測序技術的問世上,提高每個reads的長度才是王道。在生命探索的征途上,科學家們任重而道遠。

用戶名: 密碼: 匿名 快速注冊 忘記密碼
評論只代表網友觀點,不代表本站觀點。 請輸入驗證碼: 8795
Copyright(C) 1998-2025 生物器材網 電話:021-64166852;13621656896 E-mail:info@bio-equip.com
主站蜘蛛池模板: 狠狠一区二区三区 | 欧美丰满大爆乳波霸奶水多 | 性无码一区二区三区在线观看 | 国产精品久AAAAA片 | 美女脱个精光露出小网站 | 色在线看| 色婷婷激情一区二区三区 | 久久国产精品无码一区二区三区 | 女人和拘做受全程看免费软件 | CHINESE宅妇内射AV| 人澡人人| 777久久精品一区二区三区无码 | www.日本视频| 无码国产精品一区二区色情八戒 | 91精品视频一区二区三区 | 91n成人 | 中文字幕不卡免费视频 | 少妇人妻上班偷人精品视频 | 美女视频黄频A免费高清不卡 | 国产在线观看禁18 | 国产成人无码A区在线观看导航 | 色欲AV午夜一区二区三区 | 精品免费看国产一区二区 | 无码人妻精品一区二区三18禁 | AV不卡在线永久免费观看 | 欧美一级毛片免费网站 | 成人午夜精品无码一区二区三区 | 精品国产成人网站一区二区 | japan欧美性xxxx24 | 最新国模无码国产在线视频 | 波多野结衣绝顶大高潮 | 欧美精品毛片 | 色欲AV无码无在线观看 | 国产精品自在拍首页视频 | 久草在线视频福利资源站 | 三级成人在线 | 国产精品久久久久久久久久 | 国产免费AV片在线播放 | 少妇人妻14页_麻花色 | 99人精品福利在线观看 | 特黄A又粗又大又黄又爽A片 |