欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

測序方法與流程

文檔序號:12285391閱讀:787來源:國知局
本發(fā)明涉及用于使用借助合成方法的測序來對多核苷酸鏈進(jìn)行測序的方法;并且具體涉及具有改善或優(yōu)化的核苷酸流的順序的方法。本發(fā)明的方面涉及用于改善或優(yōu)化通過合成方法的測序中核苷酸流的順序的方法。發(fā)明背景借助合成方法測序通常在下一代測序(NGS)技術(shù)中使用。與靶多核苷酸片段互補(bǔ)的核苷酸鏈通過借助聚合酶的核苷酸(例如dNTP)摻入延伸,并且檢測摻入;例如,在聚合期間通過熒光或通過檢測釋放的氫離子。后一種技術(shù)用于離子半導(dǎo)體測序方法。給定的dNTP向鏈中的摻入意指在模板鏈的所述位置存在互補(bǔ)的核苷酸。在一些技術(shù)中,為不同的核苷酸提供不同的可檢測標(biāo)記,以使得可以確定所摻入的具體核苷酸。然而,備選方法僅是每次將一種單獨(dú)類型的核苷酸加入至聚合酶反應(yīng)中;如果檢測到核苷酸的摻入,則模板鏈中的互補(bǔ)核苷酸是已知的。通常,測序反應(yīng)將會通過所有四種核苷酸按順序循環(huán)進(jìn)行,并且在測序的持續(xù)時(shí)間內(nèi)將此重復(fù)。然而,這對該過程施加了時(shí)間限制,因?yàn)樾枰错樞蛑貜?fù)循環(huán)多次以獲得序列,并且取決于模板鏈中核苷酸的順序,可能需要多至四種核苷酸流以對單個(gè)堿基獲得信息。然而,對于許多借助合成技術(shù)測序的應(yīng)用來說,模板的預(yù)期序列是已知的,或者至少部分是已知的。例如,可以分析患者樣品的疑似病原體的存在,由此檢測針對給定病原體為診斷性的序列。在這個(gè)實(shí)例中,待檢測的序列是已知的。備選地,例如,可以檢測某些基因序列中的變體從而確定存在或不存在給定的多態(tài)性或突變。在這里,再一次地,序列的至少一部分是已知的。在借助合成測序的某些應(yīng)用中,通過連接或另外摻入測序引物可以與其結(jié)合的已知序列的適體(adapter),制備用于測序的多核苷酸片段。測序反應(yīng)的至少該部分可以受益于對待測序區(qū)域的了解。US2014/0031238描述了備選的核苷酸流排序的用途,其不僅僅是所有四種核苷酸的連續(xù)重復(fù)。據(jù)稱這種備選的排序解決了由不完全延伸引起的相位同步的喪失的潛在問題。未表明可以通過利用已知序列的存在來修飾核苷酸流的順序。將會有益的是提供其中核苷酸流的順序可以得到改善或優(yōu)化的借助合成方法的測序。在某些實(shí)施方案中,這利用待檢測的序列的先驗(yàn)(priori)知識而獲得。在其他實(shí)施方案中,可以選擇可能的候選序列,并且基于存在某些序列的可能性確定核苷酸流。在又一個(gè)實(shí)施方案中,可以在借助合成的測序期間使用反饋機(jī)制修改核苷酸流。發(fā)明概述根據(jù)本發(fā)明的第一方面,提供一種用于通過借助合成測序來對多核苷酸鏈進(jìn)行測序的方法,所述方法包括下列步驟:a)在反應(yīng)中提供待測序的多核苷酸鏈、引物、和聚合酶;b)以預(yù)定順序向反應(yīng)提供核苷酸,其中選擇所述預(yù)定順序以與所述多核苷酸鏈的預(yù)測序列相關(guān)聯(lián);c)監(jiān)測所述反應(yīng)以檢測核苷酸向合成的多核苷酸鏈中的摻入;其中在檢測到核苷酸摻入的情況下,接下來以所述預(yù)定順序提供下一個(gè)核苷酸。所述方法還可以包括,其中,在未檢測到核苷酸摻入的情況下,修訂所述多核苷酸鏈的所述預(yù)測序列并且選擇核苷酸的新的預(yù)定順序,其中選擇所述新的預(yù)定順序以與所述修訂的預(yù)測序列相關(guān)聯(lián)。作為修訂預(yù)測序列和繼續(xù)合成的備選方案,可以簡單地將反應(yīng)停止。在使用測序確定特定預(yù)測序列的存在的情況下(因此如果其不存在,可以將反應(yīng)停止),或者在已經(jīng)檢測到多種可能的候選預(yù)測序列的情況下,這可能會是理想的。停止反應(yīng)的再一個(gè)備選方案將會是選擇代表所有四種核苷酸的多個(gè)循環(huán)(例如,重復(fù)的A、C、G、T)的核苷酸的新的預(yù)定順序。在已經(jīng)檢測到可能的候選預(yù)測序列的情況下,這可能會是有益的,并且實(shí)際序列仍然是未知的;因此可以將測序恢復(fù)為四種核苷酸的簡單重復(fù)循環(huán)。因此,在本方法中,基于對待測序的多核苷酸的了解選擇將核苷酸提供至反應(yīng)的順序。如果預(yù)測序列是正確的,則在每次提供核苷酸時(shí)將會發(fā)生核苷酸合成(允許合成錯(cuò)誤,并且假定預(yù)定順序與預(yù)測序列完全互補(bǔ))。核苷酸摻入的檢測確認(rèn)預(yù)測序列是正確的,并且提供下一個(gè)核苷酸。如果未檢測到核苷酸摻入,則(再一次地,允許合成錯(cuò)誤)預(yù)測的核苷酸序列是不正確的。之后可以修訂預(yù)測序列以考慮誤差,并且相應(yīng)地修改核苷酸的順序。本方法因此是適應(yīng)性的,原因在于,其利用來自合成反應(yīng)的反饋從而告知并且修改提供核苷酸的順序。這允許核苷酸摻入的預(yù)期比率從1比4(其中,在每4個(gè)核苷酸流中,僅有一個(gè)是正確的)上升至更高;多至1比1,其中完美地預(yù)測了序列——盡管在實(shí)踐中較低。這不僅可以減少進(jìn)行測序操作所需的時(shí)間,而且還可以減少所需的試劑的量。核苷酸優(yōu)選是dNTP;更優(yōu)選提供四種不同的dNTP(A、C、G、T)。術(shù)語“選擇以......相關(guān)聯(lián)”優(yōu)選意指核苷酸的順序匹配與所述預(yù)測多核苷酸序列互補(bǔ)的序列的順序?!盎パa(bǔ)”優(yōu)選意指“完全互補(bǔ)”,盡管可以存在使用稍微小于100%互補(bǔ)的情況。可以基于先驗(yàn)信息預(yù)測所述預(yù)測的多核苷酸序列。例如,可以基于對可能檢測到的序列的了解來預(yù)測序列。例如,在疑似患者患有細(xì)菌或其他感染的臨床環(huán)境中,臨床情況如癥狀、近期病歷、或任何其他患者詳情的了解可以使某些特定感染比其他感染更有可能。可以基于該信息確定預(yù)測的序列。例如,如果疑似患者患有MRSA感染,則可以選擇預(yù)測序列以診斷MRSA感染??梢钥紤]多種不同感染是可能的,但是具有不同的概率。因此,所述方法可以包括下列步驟:確定多個(gè)預(yù)測序列的最初相關(guān)可能性,和在所述多個(gè)預(yù)測序列中選擇最可能的最初預(yù)測序列。所述方法還可以包括下列步驟:當(dāng)修訂所述預(yù)測序列時(shí),選擇所述多個(gè)預(yù)測序列中下一個(gè)最可能的作為所述修訂的預(yù)測序列。以這種方式,可以考慮多種可能性并且確認(rèn)或拒絕。備選地,或此外,預(yù)測序列可以基于已知的目標(biāo)序列。例如,如果進(jìn)行測定以檢測存在或不存在特定生物,則可以使用診斷該生物的多核苷酸序列作為預(yù)測的序列。這還可以延伸至涵蓋一系列不同生物——例如,16S和23S核糖體基因可以診斷許多不同生物,并且可以使用一個(gè)或另一個(gè)或二者作為最初預(yù)測序列。這可以與其中首先選擇最可能的序列的之前實(shí)施方案組合,并且之后在未檢測到核苷酸摻入的情況下將其修訂為下一個(gè)最可能的預(yù)測序列??梢允褂迷S多其他診斷序列;例如,癌基因、細(xì)菌毒素。在某些實(shí)施方案中,監(jiān)測所述反應(yīng)以檢測核苷酸的摻入的步驟還可以包括,在檢測到摻入的情況下,將代表所述核苷酸的數(shù)據(jù)加入至代表所述待測序的多核苷酸的記錄的序列數(shù)據(jù)中。代表核苷酸的數(shù)據(jù)可以代表該核苷酸的互補(bǔ)體。這允許在測序進(jìn)行時(shí)記錄序列信息。在未檢測到核苷酸摻入的情況下,也可以將代表從序列中不存在該核苷酸(或其互補(bǔ)體)的數(shù)據(jù)加入至記錄的序列數(shù)據(jù)中。修訂預(yù)測序列數(shù)據(jù)的步驟可以包括將記錄的序列數(shù)據(jù)(在相關(guān)的情況下,包括不存在給定核苷酸的信息)與在數(shù)據(jù)庫中儲存的多核苷酸序列數(shù)據(jù)進(jìn)行比較,和從匹配所述記錄的序列數(shù)據(jù)的數(shù)據(jù)庫中選擇最可能的候選序列作為修訂的預(yù)測序列。數(shù)據(jù)庫可以是遠(yuǎn)程數(shù)據(jù)庫;例如,可以經(jīng)由計(jì)算機(jī)網(wǎng)絡(luò)如互聯(lián)網(wǎng)訪問;其可以是可公開獲取的(例如GenBank序列數(shù)據(jù)庫)。備選地,數(shù)據(jù)庫可以是本地?cái)?shù)據(jù)庫;例如,儲存在本地計(jì)算機(jī)存儲器或本地?cái)?shù)據(jù)儲存設(shè)備中。數(shù)據(jù)庫可以代表序列信息的有限子集,如僅被認(rèn)為可能是目標(biāo)的那些序列。例如,數(shù)據(jù)庫可以僅包括來自常見病原的16S和23S序列數(shù)據(jù);有限數(shù)據(jù)庫的使用可以減少將記錄的序列數(shù)據(jù)與數(shù)據(jù)庫中的序列進(jìn)行比較所花費(fèi)的時(shí)間。所述方法在步驟(b)之前還可以包括同時(shí)向所述反應(yīng)提供多種不同的核苷酸。多個(gè)不同的核苷酸可以缺少四種核苷酸中的一種或兩種。這允許多核苷酸序列區(qū)域的快速延伸,直到遇到缺失的核苷酸。在序列區(qū)域已知的情況下,所述方法的這個(gè)方面可以是有用的,但是對于測序目的來說不認(rèn)為是提供信息的或令人感興趣的;可以選擇一種或多種缺失的核苷酸以允許序列延伸至、或接近目標(biāo)區(qū)域。以這種方式,可以迅速繞開非目標(biāo)區(qū)域。非目標(biāo)的已知序列的區(qū)域可以包括,例如,適體序列、或基因的高度保守的區(qū)域。可以基于非目標(biāo)的已知區(qū)域選擇要提供的多個(gè)不同核苷酸,從而確??焖俸铣稍谶_(dá)到目標(biāo)區(qū)域之前終止??梢允褂锰峁┒喾N不同的核苷酸的多個(gè)輪次。所述方法可以用于要對單個(gè)多核苷酸序列進(jìn)行測序的情況;或要對多個(gè)不同多核苷酸序列進(jìn)行測序的情況。在后一種情況中,可以選擇核苷酸的預(yù)定順序以與多個(gè)不同多核苷酸序列中的兩個(gè)以上、優(yōu)選全部的預(yù)測序列相關(guān)聯(lián)。優(yōu)選地,選擇核苷酸的順序以允許所述兩個(gè)以上不同的多核苷酸序列中的每一個(gè)的有效測序?!坝行А笨梢远x為,與在其中全部四種堿基以重復(fù)方式循環(huán)的順序(例如重復(fù)的A、C、G、T)相比,提供所摻入的堿基與在考慮中的全部序列中提供的核苷酸的改善比率的核苷酸的順序。例如,可以比較不同的序列并且確定共有序列;核苷酸的順序可以與共有序列(或其互補(bǔ)體)對應(yīng)。可以使用其他確定核苷酸的順序的方法。所述順序不需要提供最有效的測序,因?yàn)槌鲇谄渌麑?shí)際原因,最有效的順序可能會是不可能的。還在本文中還使用術(shù)語“優(yōu)化的”以指代提供有效測序的序列;再一次地,“優(yōu)化的”并不意味著序列提供最有效的測序。因此,一些序列可能比其他序列更優(yōu)化。本發(fā)明的另一個(gè)方面提供一種用于優(yōu)化借助合成反應(yīng)的測序中提供的核苷酸的順序的方法,所述方法包括下列步驟:a)確定待測序的多核苷酸的預(yù)測序列;和b)確定要提供至測序反應(yīng)的核苷酸的預(yù)定順序,其中選擇所述預(yù)定順序以與所述多核苷酸鏈的預(yù)測序列相關(guān)聯(lián)。所述方法還可以包括下列步驟:c)通過將核苷酸提供至包含所述待測序的多核苷酸的測序反應(yīng),確定所述多核苷酸鏈的實(shí)際序列;d)將所述預(yù)測序列與所述實(shí)際序列進(jìn)行比較;和e)在所述預(yù)測序列與所述實(shí)際序列不同的情況下,基于所述實(shí)際序列修訂所述多核苷酸鏈的所述預(yù)測序列并且選擇核苷酸的新的預(yù)定順序,其中選擇所述新的預(yù)定順序以與所述修訂的預(yù)測序列相關(guān)聯(lián)。本發(fā)明的這個(gè)方面的其他特征與上述第一方面相同。本發(fā)明的再一個(gè)方面提供一種用于通過借助合成測序來對多核苷酸鏈進(jìn)行測序的方法,所述方法包括下列步驟:a)在反應(yīng)中提供待測序的多核苷酸鏈、引物、和聚合酶;b)向所述反應(yīng)同時(shí)提供多種不同的核苷酸,其中所述多種不同的核苷酸缺少四種核苷酸A、C、G、T中的至少一種;c)隨后以預(yù)定順序向反應(yīng)提供核苷酸,其中選擇所述預(yù)定順序以與所述多核苷酸鏈的預(yù)測序列相關(guān)聯(lián);和d)監(jiān)測所述反應(yīng)以檢測所述預(yù)定順序的所述核苷酸向合成的多核苷酸鏈中的摻入。所述方法還可以包括下列步驟:e)在檢測到核苷酸摻入的情況下,接下來以所述預(yù)定順序提供下一個(gè)核苷酸;或f)在未檢測到核苷酸摻入的情況下,修訂所述多核苷酸鏈的所述預(yù)測序列并且選擇核苷酸的新的預(yù)定順序,其中選擇所述新的預(yù)定順序以與所述修訂的預(yù)測序列相關(guān)聯(lián)。在某些實(shí)施方案中,監(jiān)測所述反應(yīng)以檢測核苷酸的摻入的步驟還可以包括,在檢測到摻入的情況下,將代表所述核苷酸的數(shù)據(jù)加入至代表所述待測序的多核苷酸的記錄的序列數(shù)據(jù)中。代表所述核苷酸的數(shù)據(jù)可以代表核苷酸的互補(bǔ)體。這允許在測序進(jìn)行時(shí)記錄序列信息。在未檢測到核苷酸摻入的情況下,也可以將代表從序列中不存在核苷酸(或其互補(bǔ)體)的數(shù)據(jù)加入至記錄的序列數(shù)據(jù)中。修訂預(yù)測序列數(shù)據(jù)的步驟可以包括將記錄的序列數(shù)據(jù)(在相關(guān)的情況下,包括不存在給定核苷酸的信息)與在數(shù)據(jù)庫中儲存的多核苷酸序列數(shù)據(jù)進(jìn)行比較,和從匹配所述記錄的序列數(shù)據(jù)的所述數(shù)據(jù)庫中選擇最可能的候選序列作為修訂的預(yù)測序列。數(shù)據(jù)庫可以是遠(yuǎn)程數(shù)據(jù)庫;例如,可以經(jīng)由計(jì)算機(jī)網(wǎng)絡(luò)如互聯(lián)網(wǎng)訪問;其可以是可公開獲取的(例如GenBank序列數(shù)據(jù)庫)。備選地,數(shù)據(jù)庫可以是本地?cái)?shù)據(jù)庫;例如,儲存在本地計(jì)算機(jī)存儲器或本地?cái)?shù)據(jù)儲存設(shè)備中。數(shù)據(jù)庫可以代表序列信息的有限子集,如僅被認(rèn)為可能是目標(biāo)的那些序列。例如,數(shù)據(jù)庫可以僅包括來自常見病原的16S和23S序列數(shù)據(jù);有限數(shù)據(jù)庫的使用可以減少將記錄的序列數(shù)據(jù)與數(shù)據(jù)庫中的序列數(shù)據(jù)比較所花費(fèi)的時(shí)間。本發(fā)明的又一個(gè)方面提供一種用于通過借助合成測序來對多核苷酸鏈進(jìn)行測序的方法,所述方法包括下列步驟:a)在反應(yīng)中提供多個(gè)不同的待測序的多核苷酸鏈、一個(gè)或多個(gè)引物、和聚合酶;b)以預(yù)定順序向反應(yīng)提供核苷酸,其中選擇所述預(yù)定順序以與所述多個(gè)不同的多核苷酸鏈的預(yù)測序列相關(guān)聯(lián);和c)監(jiān)測所述反應(yīng)以檢測所述預(yù)定順序的所述核苷酸向合成的多核苷酸鏈中的摻入;其中選擇核苷酸的所述預(yù)定順序以允許所述多個(gè)不同的多核苷酸序列中的每一個(gè)的有效測序?!坝行А笨梢远x為,與在其中全部四種堿基簡單循環(huán)的順序(例如重復(fù)的A、C、G、T)相比,提供所摻入的堿基與在考慮中的全部序列中提供的核苷酸的改善比率的核苷酸的順序。例如,可以比較不同的序列并且確定共有序列;核苷酸的順序可以與共有序列(或其互補(bǔ)體)對應(yīng)。可以使用其他確定核苷酸的順序的方法。所述順序不需要提供最有效的測序,因?yàn)槌鲇谄渌麑?shí)際原因,最有效的順序可能會是不可能的。發(fā)明詳述本發(fā)明涉及通過改變核苷酸遞送的順序來減少確定特定多核苷酸樣品的核苷酸序列所花費(fèi)的時(shí)間。通常,在借助合成方法的測序中,以固定順序(例如,A、C、G、T)將核苷酸單獨(dú)提供至測序反應(yīng);如果存在要加入至合成的鏈中的下一個(gè)核苷酸,則鏈將會延伸,并且檢測延伸。從反應(yīng)中洗滌未使用的核苷酸,并且加入序列中的下一個(gè)核苷酸。使用ISFET傳感器對DNA進(jìn)行測序通常包括核苷酸(T、G、C、A)在芯片上的連續(xù)流動。如果橫跨芯片流動的特定核苷酸在模板鏈上發(fā)現(xiàn)其互補(bǔ)核苷酸,則氫離子被釋放并且作為以mV表示的改變而被ISFET傳感器檢測。通常,每個(gè)單獨(dú)的傳感器檢測從DNA模板的克隆群體中釋放的氫離子,所述克隆群體可以通過克隆擴(kuò)增技術(shù)如emPCR產(chǎn)生,并且固定在孔內(nèi)的珠上。每個(gè)克隆群體可以含有數(shù)百萬個(gè)相同的DNA拷貝。在文獻(xiàn)中報(bào)道,當(dāng)使用標(biāo)準(zhǔn)的4-核苷酸循環(huán)時(shí),隨機(jī)DNA序列每個(gè)循環(huán)將會延伸大約2.4個(gè)堿基。這是因?yàn)椴皇敲總€(gè)核苷酸流都在模板鏈上具有相應(yīng)的互補(bǔ)堿基,結(jié)果是大約40%的流返回零或0聚體結(jié)果。發(fā)明人在本文中描述了許多可以用于優(yōu)化遞送至生長鏈的核苷酸的順序的方法,并且因此減少了對樣品進(jìn)行測序所花費(fèi)的時(shí)間。方法在本文中單獨(dú)描述,但是應(yīng)該理解的是,一個(gè)或多個(gè)可以組合使用。本發(fā)明意在減少對特定目標(biāo)樣品進(jìn)行測序所花費(fèi)的時(shí)間。序列可以允許在較短時(shí)間內(nèi)讀取某一長度的序列,或者允許在相同時(shí)間段內(nèi)較長的讀取長度。所有方法共享共有特征:基于對待測序樣品的一些了解事先確定要提供至反應(yīng)的核苷酸的順序。在某些方法中,目前可以在測序期間基于測序結(jié)果修改核苷酸的順序。考慮到各種臨床因素,可以基于概率算法將核苷酸的順序選擇為先驗(yàn)。在預(yù)測正確序列的情況中,通過調(diào)整核苷酸流以匹配預(yù)測序列,每個(gè)流動事件的效率增加至高達(dá)100%。在本發(fā)明的一個(gè)實(shí)例中,目標(biāo)樣品可以是靶序列,其中可以做出關(guān)于樣品匹配某序列的概率的假設(shè)。例如,在可以將其他患者數(shù)據(jù)提供給系統(tǒng)以確定某些傳染原可能存在的臨床環(huán)境中。在另一個(gè)實(shí)例中,取決于關(guān)于已經(jīng)確定的DNA序列的反饋,可以在整個(gè)檢測過程中智能地確定和升級向芯片的核苷酸遞送的序列。與從頭或極高通量DNA測序相比,本發(fā)明考慮了當(dāng)樣品靶向至特定的基因區(qū)域時(shí)的特定相關(guān)性??梢葬槍悠沸蛄衅ヅ湟阎獏⒄招蛄械母怕首龀黾僭O(shè)。對于靶向測序應(yīng)用來說,存在通過減少進(jìn)行檢測所花費(fèi)的時(shí)間來提高性能的余地。歸因于靶向序列可以是已知的或者可以在某種程度上預(yù)測的事實(shí),可以調(diào)節(jié)核苷酸流動形式以增加檢測的通量和效率。如在本文中討論的,確定了在其中可以應(yīng)用這個(gè)概念的四種主要方式:1.預(yù)測性核苷酸流2.適應(yīng)性核苷酸流3.多核苷酸流4.多個(gè)模板的優(yōu)化流如以下給出的,可以以多種方式實(shí)施本發(fā)明。1)預(yù)測性序列流在可能在對處于詢問中的特定樣品進(jìn)行檢測之前做出概率評估的情況中。這可以包括樣品的“未知”區(qū)域和“已知”區(qū)域(如用于預(yù)擴(kuò)增或文庫制備的引物序列)二者。概率評估可以包括從各種其他來源獲得的進(jìn)一步的臨床患者數(shù)據(jù),其之后被輸入至測序儀器中。可以由醫(yī)師簡單地進(jìn)行概率評估(例如,在回顧患者的病史和癥狀之后,它們推斷感染最可能是細(xì)菌#1,但是存在感染是細(xì)菌#2、或細(xì)菌#3的較小的可能性)。備選地,概率評估可以利用用于確定各種感染的相關(guān)可能性(relativelikelihood)的專家系統(tǒng)或相似的自動化工具。專家系統(tǒng)可以根據(jù)在測序儀器上進(jìn)行的概率評估(或者實(shí)際上作為單獨(dú)的系統(tǒng),例如,執(zhí)行適合的計(jì)算機(jī)程序的計(jì)算機(jī)系統(tǒng))而執(zhí)行以鑒別對于給定患者來說“最可能的”傳染原。-由臨床醫(yī)師輸入儀器的數(shù)據(jù)包括,例如,相關(guān)的患者病史(近期手術(shù)或創(chuàng)傷、近期感染、用藥等)和本地醫(yī)院數(shù)據(jù)(傳染疾病概況、近期抗生素抗性爆發(fā)等)-如以下表中(其僅是說明性的實(shí)例)的,算法基于輸入的數(shù)據(jù)預(yù)測最可能的傳染原。-調(diào)節(jié)最初核苷酸流以完全匹配預(yù)測的傳染原的核苷酸流。傳染原感染概率細(xì)菌150%細(xì)菌220%細(xì)菌310%細(xì)菌42%細(xì)菌52%細(xì)菌6<1%在備選方案中,醫(yī)師可以檢查患者和推斷感染最可能由第一傳染原導(dǎo)致,但是存在感染歸因于第二或第三傳染原的較小的可能性(即不使用專家系統(tǒng)或不直接分配定量概率)。在這種情況下,醫(yī)師(或技術(shù)人員)可以將三種潛在傳染原的清單直接輸入至測序儀器中;儀器之后將會按順序選取三種潛在傳染原中的每一個(gè)作為預(yù)測的傳染原,并且因此將最初核苷酸流調(diào)整為第一預(yù)測的傳染原。在大多數(shù)情況中,可以選擇提供信息的基因用于測序(例如,來自細(xì)菌的核糖體基因),并且在最可能的預(yù)測的傳染原中的該基因的序列用于確定最初核苷酸流的序列。2)適應(yīng)性序列流依賴于來自測序儀器的實(shí)時(shí)反饋,并且相應(yīng)地調(diào)整核苷酸的形式。這將會包括將輸出數(shù)據(jù)引用(連續(xù)地,或在某些時(shí)間點(diǎn))至數(shù)據(jù)庫,并且基于已經(jīng)產(chǎn)生的數(shù)據(jù)調(diào)整將來的核苷酸流形式。在關(guān)于處于詢問中的序列已知較少或者最初預(yù)測的序列證明是不正確的情況下,這種方法是有用的。適應(yīng)性序列流基于來自儀器的實(shí)時(shí)反饋改變流形式。實(shí)施例如上所述進(jìn)行最初概率評估,并且測序儀器確定核苷酸流的最初順序,所述順序被調(diào)節(jié)為“最可能的”傳染原。如果預(yù)測序列不正確,則由儀器檢測到無法使模板延伸,并且確定修訂的預(yù)測序列并且使用其確定新的核苷酸流的順序。例如,最初評估提供以下概率:傳染原感染概率細(xì)菌150%細(xì)菌220%細(xì)菌310%細(xì)菌42%細(xì)菌52%細(xì)菌6<1%感染實(shí)際上是細(xì)菌#3。算法基于概率評估不正確地預(yù)測了細(xì)菌#1,并且儀器開始將核苷酸流調(diào)節(jié)為細(xì)菌#1序列。-細(xì)菌#3:樣品序列GCACCTGTCTCAGAGTTCCCGAAGGCACCAAAGCATC-基于細(xì)菌#1的流形式CGTGGACAGAGTGC在每個(gè)核苷酸在靶鏈上使模板延伸時(shí),儀器記錄代表每個(gè)核苷酸和靶和/或合成鏈的序列的數(shù)據(jù)。在遇到第一錯(cuò)配的堿基時(shí),儀器經(jīng)由核苷酸進(jìn)行循環(huán)以尋找正確的堿基:-細(xì)菌#3:樣品序列GCACCTGTCTCAGAGTTCCCGAAGGCACCAAAGCATC細(xì)菌#1CGTGGACAGAGTGT在這種情況下,核苷酸順序預(yù)測C將會是序列中的下一個(gè)堿基,以匹配細(xì)菌#1序列。然而,C不使模板序列延伸;因此,儀器未檢測到延伸事件,并且提供其余的核苷酸(A、G、T)以確定哪一個(gè)使模板延伸。在這種情況下,T使模板延伸。將該信息加入至合成序列的記錄中?;谒@得的序列,儀器將目前獲得的序列與下一個(gè)最可能的序列(在這種情況下,是細(xì)菌#2)進(jìn)行比較,并且如果在這種情況下,下一個(gè)最可能的序列匹配目前的合成鏈,則下一個(gè)最可能的序列成為新的預(yù)測序列,并且修訂核苷酸流順序以對應(yīng)于新的預(yù)測序列。儀器之后重新開始將核苷酸流調(diào)節(jié)為細(xì)菌#2:-細(xì)菌#3:樣品序列GCACCTGTCTCAGAGTTCCCGAAGGCACCAAGCATC-基于細(xì)菌#2的流形式CGTGGACAGAGTGTCAAGGGCTTCCGTGGTTA在遇到另一個(gè)錯(cuò)配(在這里,當(dāng)將預(yù)測序列引導(dǎo)至A的流順序時(shí)為G)時(shí),儀器再次無法檢測到延伸事件并且再次經(jīng)由其余核苷酸進(jìn)行循環(huán)以尋找正確的堿基插入:-細(xì)菌#3:樣品序列GCACCTGTCTCAGAGTTCCCGAAGGCACCAAGCATCCGTGGACAGAGTGTCAAGGGCTTCCGTGGTTC基于所獲得的序列和各種傳染原的相關(guān)可能性,算法將預(yù)測序列修訂為細(xì)菌#3的序列,并且重新開始將核苷酸流調(diào)節(jié)為細(xì)菌#3。-細(xì)菌#3:樣品序列GCACCTGTCTCAGAGTTCCCGAAGGCACCAAAGCATC-基于細(xì)菌#3的流形式CGTGGACAGAGTCTCAAGGGCTTCCGTGGTTTCGTAG當(dāng)達(dá)到合成序列末端而沒有進(jìn)一步的錯(cuò)配時(shí),做出感染是細(xì)菌#3的結(jié)論。儀器停止運(yùn)行,并且顯示表示檢測到的感染的輸出信息。3)多核苷酸流上述途徑利用利用在每個(gè)流事件中每次提供一個(gè)單個(gè)核苷酸的方法。當(dāng)其是測序的目標(biāo)區(qū)域時(shí)這是優(yōu)選的,因?yàn)樗试S將檢測的序列與預(yù)測序列進(jìn)行比較,并且如果需要,修訂預(yù)測序列。然而,在許多情況下,將會存在需要在可以對目標(biāo)區(qū)域測序之前測序的至少一些非目標(biāo)區(qū)域;例如,可以在待分析的樣品中包含用于制備用于測序的樣品的引物或適體,并且對于目標(biāo)區(qū)域的確定來說,這些區(qū)域不提供信息。備選地,基因中高度保守的區(qū)域可能不被認(rèn)為是目標(biāo)的,因?yàn)樗鼈儾辉试S使用者在備選序列之間進(jìn)行區(qū)分。通過在特定流事件中結(jié)合2或3個(gè)核苷酸,可以“快速前進(jìn)(fast-track)”通過已知序列的區(qū)域。例如,可以使已知引物序列以非常小的數(shù)量的流延伸,而不使“未知”的目標(biāo)序列延伸。這可以用于使高度保守的區(qū)域延伸,例如在細(xì)菌16S和23SrRNA基因中,或在人癌基因的罕見突變區(qū)域中。-如上,可以進(jìn)行“概率評估”以將傳染原按可能性順序排名,并且確定核苷酸的順序以匹配“最可能的”傳染原的序列?;谠撔蛄虚_始核苷酸流。-例如,序列的最初部分可以是在細(xì)菌之間保守的-細(xì)菌4CACCTGTCACTCTACTAACGTATGGCTACCCT-細(xì)菌5CACCTGTCCGAATGAGTATCTTATTACCATTG-細(xì)菌6CACCTGTCATACGACGCATACGGTTCGAAACA-在這種情況下,可以通過混合2鐘以上核苷酸來“快速前進(jìn)”通過保守區(qū)域,而不是使單獨(dú)的核苷酸流動以對最初的不提供信息的CACCTGTC部分進(jìn)行測序。這可以使用混合核苷酸的專用試劑儲庫(reservior)完成,或者通過“在傳輸過程中(on-the-fly)”混合核苷酸完成。-在標(biāo)準(zhǔn)核苷酸命名中:·“C和A”可以由“M”表示(對于含有氨基(aMion)的核苷酸來說)·“T和G”可以由“K”表示(對于含有酮基(Keto)的核苷酸來說)-在這個(gè)實(shí)例中,M接著K的最初流將會在保守區(qū)域中延伸7個(gè)堿基:-細(xì)菌4CACCTGTCACTCTACTAACGTATGGCTACCCT-細(xì)菌5CACCTGTCCGAATGAGTATCTTATTACCATTG-細(xì)菌6CACCTGTCATACGACGCATACGGTTCGAAACA-多核苷酸流M>>>K>>--盡管儀器將會檢測到已經(jīng)發(fā)生了延伸事件,哪個(gè)核苷酸使序列延伸將不會是明顯的。然而,對于這個(gè)保守區(qū)域來說,這不是令人擔(dān)憂的。在一些實(shí)施方案中,可以一起提供三種核苷酸;例如,提供A、C、和T的混合物將會使CACCT的最初序列延伸,并且在隨后的G停止。在這個(gè)最初序列“快速前進(jìn)”通過已知的保守區(qū)域之后,可以將核苷酸的順序恢復(fù)為如以上所討論的預(yù)測性或適應(yīng)性序列,以繼續(xù)測序檢測。4)多個(gè)序列的優(yōu)化流在許多應(yīng)用中,將會存在>1個(gè)需要測序的序列。在這種情況下,可以創(chuàng)建算法以確定用于對全部模板進(jìn)行序列的最有效的核苷酸流形式。實(shí)際上,模擬顯示,當(dāng)根據(jù)以下所述的基本算法優(yōu)化流形式時(shí),可以使對三個(gè)50bp靶模板進(jìn)行測序所需的核苷酸流的數(shù)量降低多至28%。-如上,可以進(jìn)行“概率評估”以將傳染原按可能性順序排名,并且確定核苷酸的順序以匹配“最可能的”傳染原的序列?;谠撔蛄惺购塑账崃鏖_始。-存在具有>1個(gè)處于詢問中的序列的情況。例如,在腫瘤應(yīng)用中,可能存在許多待測序的癌基因。-對于血流感染來說,如果需要檢測以提供詳細(xì)鑒別,甚至在單一生物內(nèi),也可以存在>1個(gè)處于詢問中的基因組區(qū)域。-以下序列代表可能需要同時(shí)測序的多個(gè)序列·序列1ACTCTACTAACGTATGGCTACCCTTAGTGGGGATGCTACCTAAAACCCTTC·序列2CGAATGAGTATCTTATTACCATTTTGCAGTCCAATGTTTTAATTGTGTTGT·序列3ATACGACGCATACGGTTCGAAACAAGAACGTACAATGTACGGAACTCGACA·使用T、G、C、A循環(huán)流形式需要100個(gè)流事件以對全部三個(gè)靶標(biāo)進(jìn)行測序。·最佳流形式在72個(gè)流事件中對全部模板進(jìn)行測序:-ACTGACTGACGTACGTATCGACTAGTCAGTACAGTGACTGACTACGTACTGATCGATCGATCGTCGATCGAT--流持續(xù)時(shí)間降低28%-可以將最佳形式確定為使流事件數(shù)量最小化的形式以對全部目標(biāo)模板進(jìn)行測序??梢允褂脗溥x定義。-在這種情況中,序列不彼此類似或共享顯著同源性的區(qū)域。然而,可以確定在最短的可能時(shí)間內(nèi)完成全部序列的延伸的非循環(huán)核苷酸流形式。-與這個(gè)方面結(jié)合使用的預(yù)測性和適應(yīng)性算法將會進(jìn)一步優(yōu)化檢測并且減少持續(xù)時(shí)間。以下給出了多個(gè)靶區(qū)域,以及對全部靶標(biāo)進(jìn)行測序所需的循環(huán)的降低的另一個(gè)實(shí)例:代表性的靶序列:序列1ACTCTACTAACGTATGGCTACCCTTAGTGGGGATGCTACCTAAAACCCTTC序列2CGAATGAGTATCTTATTACCATTTTGCAGTCCAATGTTTTAATTGTGTTGT序列3ATACGACGCATACGGTTCGAAACAAGAACGTACAATGTACGGAACTCGACA使用全部四種核苷酸的簡單循環(huán),這些中的每一種將會分別選取84、72、和100個(gè)核苷酸以完全測序。使用優(yōu)化的序列,ACTGACTGACGTACGTATCGACTAGTCAGTACAGTGACTGACTACGTACTGATCGATCGATCGTCGATCGAT,可以在72個(gè)核苷酸中完成全部靶序列的測序。如下給出優(yōu)化過程的實(shí)例。注意,這僅是一個(gè)實(shí)例;可以使用其他算法,并且可能的是,這樣的其他算法將會提供更大的優(yōu)化程度。簡而言之,算法觀察每個(gè)DNA鏈中下一個(gè)待測序的堿基,并且選擇最可能出現(xiàn)的堿基。如果存在兩個(gè)以上相同可能出現(xiàn)的堿基,其選擇已經(jīng)等待流動時(shí)間最長的堿基。作為用于描述算法的起點(diǎn),假定我們希望對我們確信含有以下DNA序列中的一個(gè)的樣品進(jìn)行序列:序列1:ACTCTACTAACGTATGGCTACCCTTAGTGGGGATGCTACCTAAAACCCTTC序列2:CGAATGAGTATCTTATTACCATTTTGCAGTCCAATGTTTTAATTGTGTTGT序列3:ATACGACGCATACGGTTCGAAACAAGAACGTACAATGTACGGAACTCGACA對于每個(gè)序列來說,算法維持朝向下一個(gè)待測序的堿基的指針(pointer)。在以下詳情中,這些指針被表示為每個(gè)序列下方的箭頭。以下部分示出了算法的前十個(gè)步驟以說明其是如何工作的。流步驟1在第一核苷酸流之前,每個(gè)序列中的當(dāng)前位置如下所示:序列1ACTCTACTAACGTATGGCTACCCTTAGTGGGGATGCTACCTAAAACCCTTC^序列2CGAATGAGTATCTTATTACCATTTTGCAGTCCAATGTTTTAATTGTGTTGT^序列3ATACGACGCATACGGTTCGAAACAAGAACGTACAATGTACGGAACTCGACA^在這種情況中,序列中的兩個(gè)是A并且一個(gè)是C。因此,要流動的第一核苷酸將會是A,因?yàn)檫@更有可能得到延伸。流步驟2在這個(gè)核苷酸流之前,每個(gè)序列中的當(dāng)前位置如下所示:序列1ACTCTACTAACGTATGGCTACCCTTAGTGGGGATGCTACCTAAAACCCTTC-^序列2CGAATGAGTATCTTATTACCATTTTGCAGTCCAATGTTTTAATTGTGTTGT^序列3ATACGACGCATACGGTTCGAAACAAGAACGTACAATGTACGGAACTCGACA-^在這種情況下,核苷酸中的兩個(gè)是C并且一個(gè)是T。算法選擇C,因?yàn)檫@最有可能得到延伸。流步驟3在這個(gè)核苷酸流之前,每個(gè)序列中的當(dāng)前位置如下所示:序列1ACTCTACTAACGTATGGCTACCCTTAGTGGGGATGCTACCTAAAACCCTTC-^序列2CGAATGAGTATCTTATTACCATTTTGCAGTCCAATGTTTTAATTGTGTTGT-^序列3ATACGACGCATACGGTTCGAAACAAGAACGTACAATGTACGGAACTCGACA-^在這種情況下,核苷酸中的兩個(gè)是T并且一個(gè)是G。算法選擇T,因?yàn)檫@最有可能得到延伸。流步驟4在這個(gè)核苷酸流之前,每個(gè)序列中的當(dāng)前位置如下所示:序列1ACTCTACTAACGTATGGCTACCCTTAGTGGGGATGCTACCTAAAACCCTTC-^序列2CGAATGAGTATCTTATTACCATTTTGCAGTCCAATGTTTTAATTGTGTTGT-^序列3ATACGACGCATACGGTTCGAAACAAGAACGTACAATGTACGGAACTCGACA-^在這種情況下,三個(gè)核苷酸C、G、和A都是相同可能的。等待最長的核苷酸是G,并且因此將其選擇為序列中的下一個(gè)核苷酸。流步驟5在這個(gè)核苷酸流之前,每個(gè)序列中的當(dāng)前位置如下所示:序列1ACTCTACTAACGTATGGCTACCCTTAGTGGGGATGCTACCTAAAACCCTTC-^序列2CGAATGAGTATCTTATTACCATTTTGCAGTCCAATGTTTTAATTGTGTTGT-^序列3ATACGACGCATACGGTTCGAAACAAGAACGTACAATGTACGGAACTCGACA-^在這種情況中,核苷酸A是最可能的,因此選擇它。流步驟6在這個(gè)核苷酸流之前,每個(gè)序列中的當(dāng)前位置如下所示:序列1ACTCTACTAACGTATGGCTACCCTTAGTGGGGATGCTACCTAAAACCCTTC-^序列2CGAATGAGTATCTTATTACCATTTTGCAGTCCAATGTTTTAATTGTGTTGT-^序列3ATACGACGCATACGGTTCGAAACAAGAACGTACAATGTACGGAACTCGACA-^在這種情況中,核苷酸C是最可能的,因此我們選擇它。流步驟7在這個(gè)核苷酸流之前,每個(gè)序列中的當(dāng)前位置如下所示:序列1ACTCTACTAACGTATGGCTACCCTTAGTGGGGATGCTACCTAAAACCCTTC-^序列2CGAATGAGTATCTTATTACCATTTTGCAGTCCAATGTTTTAATTGTGTTGT-^序列3ATACGACGCATACGGTTCGAAACAAGAACGTACAATGTACGGAACTCGACA-^在這種情況中,核苷酸T是最可能的,因此我們選擇它。流步驟8在這個(gè)核苷酸流之前,每個(gè)序列中的當(dāng)前位置如下所示:序列1ACTCTACTAACGTATGGCTACCCTTAGTGGGGATGCTACCTAAAACCCTTC-^序列2CGAATGAGTATCTTATTACCATTTTGCAGTCCAATGTTTTAATTGTGTTGT-^序列3ATACGACGCATACGGTTCGAAACAAGAACGTACAATGTACGGAACTCGACA-^在這種情況中,核苷酸G是最可能的,因此我們選擇它。流步驟9在這個(gè)核苷酸流之前,每個(gè)序列中的當(dāng)前位置如下所示:序列1ACTCTACTAACGTATGGCTACCCTTAGTGGGGATGCTACCTAAAACCCTTC-^序列2CGAATGAGTATCTTATTACCATTTTGCAGTCCAATGTTTTAATTGTGTTGT-^序列3ATACGACGCATACGGTTCGAAACAAGAACGTACAATGTACGGAACTCGACA-^在這種情況下,所有序列都需要核苷酸A,因此我們選擇它。流步驟10在這個(gè)核苷酸流之前,每個(gè)序列中的當(dāng)前位置如下所示:序列1ACTCTACTAACGTATGGCTACCCTTAGTGGGGATGCTACCTAAAACCCTTC-^序列2CGAATGAGTATCTTATTACCATTTTGCAGTCCAATGTTTTAATTGTGTTGT-^序列3ATACGACGCATACGGTTCGAAACAAGAACGTACAATGTACGGAACTCGACA-^在這種情況中,核苷酸C是最可能的,因此選擇它。在許多應(yīng)用中,將會有益的是組合以上實(shí)施方法中的若干個(gè)。例如,在血流感染工具中,概率算法可以預(yù)測最可能的傳染原。通過預(yù)測多個(gè)16S擴(kuò)增子的序列,可以確定優(yōu)化的流形式。在檢測期間,如果預(yù)測的傳染原結(jié)果是不正確的,智能的適應(yīng)性流可以基于修訂的概率算法調(diào)節(jié)最佳核苷酸流形式。考慮到對確定多個(gè)靶序列的最佳流序列的限制,本發(fā)明的各個(gè)方面可能主要適用于其中可能存在僅一個(gè)或少量的序列的情況。當(dāng)前第1頁1 2 3 
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
杨浦区| 卢湾区| 江孜县| 治多县| 孝昌县| 木里| 日照市| 罗源县| 柘城县| 裕民县| 德州市| 蕉岭县| 金乡县| 洛川县| 盖州市| 鸡东县| 达拉特旗| 枞阳县| 大兴区| 肃宁县| 荔波县| 横峰县| 普安县| 兴宁市| 德保县| 阜平县| 琼海市| 田东县| 定陶县| 昌宁县| 禹州市| 桐柏县| 内江市| 鄂州市| 扎兰屯市| 连州市| 五常市| 云浮市| 台江县| 莱芜市| 安平县|