文獻解讀

circRNA測序案例解讀-農學

返回列表
2019-01-21 15:12    編輯:admin
玉米中轉座子介導的環狀RNA與轉錄組層面和表型變異有關
Circular RNAs mediated by transposons are associated with transcriptomic and phenotypic variation in maize
New Phytologist (2018) 217: 1292–1306
doi: 10.1111/nph.14901
 

背景

         環狀RNA(circRNA)是一類共價封閉的單鏈RNA分子。約30年前,一些circRNA被確定并被認為是異常剪接和轉錄噪音。然而最近,circRNA被大量報道,并且發現circRNA可以影響親本線性轉錄本的表達。在植物中,circRNA在擬南芥和水稻中已被在全基因組范圍內鑒定。然而circRNA在玉米中的研究相對較少。玉米是世界上廣泛種植的作物之一,并且其基因組上含有高于85%的重復序列。那么玉米中全基因組上circRNA的分布如何,重復序列與circRNA的形成是否有關系,與玉米的表型是否有關系,這些都是亟待解決的問題。
 

主要材料方法

1. 材料與數據
         測序數據:玉米自交系B73兩周幼苗circRNA-Seq(NCBI序列號PRJNA356366)和poly(A)選擇的mRNA-Seq(NCBI序列號PRJNA356498)。
         公共數據:977個公共的玉米RNA-Seq數據,包括不同B73組織(葉、種子、胚、幼苗、胚乳、胚囊、胚珠、花粉、根和莖頂端分生組織)和不同玉米自交系種子(NCBI序列號SRP026161和SRP018753)。
 
2. 主要分析流程

         (1)circRNA的生物信息學鑒定。主要使用的circRNA鑒定軟件為KNIFE、CIRCexplorer2、CIRI、circ_finder等(具體流程可以參見圖1a)。
         (2)circRNA基因組特征分析。
         (3)circRNA側翼區域重復序列富集情況分析。使用方法RepeatMasker。
         (4)circRNA與母基因線性轉錄本表達量分析。
         (5)circRNA側翼區域重復序列產生miRNA情況分析。
         (6)circRNA側翼區域重復序列與玉米表型變異相關分析。對于43個玉米自交系的GRMZM2G089149基因(能夠產生circRNA,并且含有LLERCP重復序列)進行circRNA和線性轉錄本的表達量分析等。
 

主要結果

1. 環狀RNA在玉米中廣泛存在
         環狀RNA(circRNA)可以根據他們在基因組上的來源分為基因間區和基因上類型。為了鑒定玉米circRNA,該課題組對玉米自交系B73的兩周幼苗進行了circRNA-Seq,并且收集了977個公共的玉米RNA-Seq數據,包括不同B73組織和不同玉米自交系種子。
         在977個公共的玉米RNA-Seq數據中,使用的circRNA鑒定軟件為KNIFE(圖1a),在嚴格的過濾條件之后,只鑒定到256個高可信度circRNA。隨機選取14個circRNA進行試驗驗證(10個來源于兩個基因,4個來源于單個基因),發現只有4個來源于兩個基因的circRNA和所有來源于單個基因的circRNA被證實。因此,在后續的研究中,該課題組只分析來源于單個基因的circRNA。
         對于circRNA-Seq鑒定到的circRNA(使用的circRNA鑒定軟件為CIRCexplorer2、CIRI、circ_finder,圖1a),預實驗表明,若隨機選取只有一條讀序支持的circRNA進行PCR實驗,發現只有約10%的驗證率;而當隨機選取兩條讀序支持的circRNA時,驗證率提高到85%。因此,該課題組選擇至少有兩條讀序支持的circRNA進行后續的研究。他們一共在玉米中鑒定到了5329個符合要求的circRNA。5329個circRNA中,大約一半(2235)來源于未知的剪接位點,并且小于21%的circRNA可以被多個軟件鑒定到。
         由于每個circRNA鑒定軟件的準確性和精確度都存在差異,而隨機選取的實驗驗證發現CIRCexplorer2和CIRI(剪接位點已注釋的circRNA)鑒定的circRNA具有較高的可信度(隨機選取10個circRNA,其中CIRCexplorer2鑒定的有9個能被驗證到,CIRI中剪接位點已注釋的有7個能被驗證到,而circ_finder鑒定的只有3個、CIRI中剪接位點未注釋只有2個能被實驗證實)。因此,該課題組選擇至少有兩條讀序支持的、被CIRCexplorer2和CIRI(剪接位點已注釋)鑒定的circRNA為高可信度circRNA,并且進行后續研究。
         該課題組主要研究外顯子類型circRNA(圖1b),因為這些circRNA可能與基因表達和表型變異直接相關。為了驗證鑒定的這些circRNA,該課題組隨機選擇了15個circRNA候選,PCR和Sanger測序結果都表明這些circRNA的實際存在(其中一個例子如圖1c)。通過整理各軟件鑒定的高可信度circRNA,一共有來自2009個基因位點的2804個外顯子類型circRNA被鑒定到,其在基因組上的分布如圖1d
 
 
圖1 玉米circRNA全基因組鑒定。
 
2. 產生circRNA的基因(包括circRNA)與不產生circRNA的基因存在明顯不同的特征

         為了了解circRNA以及產生circRNA的基因位點的特征,該課題組將產生circRNA的基因位點和隨機選擇的不產生circRNA的位點進行特征比較。結果發現,能夠產生circRNA的基因長度比隨機選擇的不產生circRNA的基因長度長(圖2a)。circRNA的外顯子長度比一般的線性外顯子長度短(圖2b)。circRNA的相鄰兩邊內含子長度比一般基因的內含子長度長(圖2c)。雖然circRNA的表達量往往都比較低,但是他們的母基因的表達量卻往往是比較高的(圖2d)。然而circRNA的表達量與其母基因表達量之間并沒有明顯的相關性,這也揭示了玉米中circRNA和mRNA這兩種RNA之間的關系的復雜性。
 
 
圖2 玉米中circRNA的基因組特征。
 
3. 逆轉錄轉座子LLE和LLERCP(LLE和LLE反向互補序列組成的序列對)在circRNA的側翼區域顯著富集

         為了探究轉座子是否在circRNA的形成和表達中起到作用,該課題組使用RepeatMasker軟件注釋了剪接位點上下35kb的基因組序列的重復元件(圖3a)。結果顯示,三種轉座子LLE、LRE和DLE在circRNA的兩邊側翼區域都顯著富集,并且與他們的反向互補序列在circRNA的兩側形成Watson–Crick互補莖環結構(分別叫做LLERCP、LRERCP和DLERCP,圖3b),這種結構能夠促進circRNA的形成。然而,相對來說LRERCP和DLERCP在circRNA的側翼區域含量較LLERCP少,因此該課題組選擇LLERCP來做后續研究。
         通過比較五種基因,分別是產生circRNA的基因、隨機選擇的不產生circRNA的基因、長度最長的基因、內含子長度較長的基因、相對高表達的基因,結果發現LLE在產生circRNA的基因中顯著富集(圖3c)。然而,產生circRNA的基因和長度最長的基因上LLE的富集程度比較接近(62%和58%),說明LLE的存在并不是circRNA形成的直接原因。相比于其他類型的基因,LLERCP在產生circRNA的基因的側翼區域顯著富集(圖3d)。此外,相比于單個LLE在circRNA側翼區域富集,LLERCP在circRNA的上游和下游側翼區域成對富集的情況更加普遍,這說明LLERCP可能參與circRNA形成的過程(圖3b)。
 
 
 
圖3 circRNA側翼區域逆轉錄轉座子LLE和LLERCP的富集情況。具體說明見文中。
 
4. LLERCP與circRNA和線性RNA的表達量相關

         為了探究LLERCP是否對circRNA的表達量有關系,該課題組鑒定了51個既能夠產生有LLERCP的circRNA,也能產生沒有LLERCP序列的circRNA(圖4a)。對含有LLERCP和不含有LLERCP的circRNA的表達量進行t檢驗,發現側翼區域含有LLERCP的circRNA的表達量顯著高于沒有LLERCP的,這也表明LLERCP可能增強circRNA的表達(圖4b)。此外,circRNA的表達量隨著LLERCP數量的增加而顯著變化,表明LLERCP在circRNA中有著潛在調節機制(圖4c)。恰恰相反,線性RNA的表達量隨著LLERCP的增加而顯著降低(圖4d)。circRNA和線性RNA隨著LLERCP的數量增加的表達量變化,也揭示了circRNA和線性RNA之間的復雜關系。總而言之,LLERCP的數量可能在circRNA和線性RNA之間的表達量起到調節作用。
 
 
圖4 玉米中LLERCP的數量與circRNA和線性RNA的表達量相關。具體說明見文中。
 
5. 玉米中LLERCP與小RNA的相關性較小

         LLERCP可以在circRNA的成環過程中形成莖環結構(圖5a)。這些莖環結構與小RNA形成過程中的莖環結構相似。為了研究小RNA和LLERCP形成的莖環結構之間的聯系,該課題組下載了玉米自交系B73兩周幼苗的sRNA-Seq序列,并且將序列比對到玉米基因組,而后計算所有LLE內部產生的21-25nt長的小RNA的表達量。總的來說,比對到circRNA側翼LLERCP上的小RNA讀序比比對到隨機選擇的LLE上的讀序少(圖5b-c)。也就是說,小RNA往往是在隨機選擇的基因組上的LLE上產生,而不是在circRNA側翼的LLERCP產生。這些結果表明,LLERCP可能能夠穩定轉錄本的二級結構,促進circRNA的形成。
 
圖5 玉米中來源于LLERCP的小RNA的情況。具體說明見文中。
 
6. LLERCP含量的變化與玉米中的表型變化相關

         為了探究circRNA的潛在功能,GO富集分析發現circRNA可能與細胞進程(P= 4.40E-14)、綁定(P= 8.20E-09)或者細胞器(P= 3.4E-27)相關。此外,產生circRNA的基因與表型變異相關基因(基于GWAS結果)有重復。相比于隨機選擇的其他類型基因(隨機選擇的不產生circRNA的基因、長度最長的基因、內含子長度較長的基因、相對高表達的基因),產生circRNA的基因含有顯著多的表型相關位點(圖6a)。這個結果表明,circRNA可能與表型變異相關。更有趣的是,產生circRNA的基因中有17%含有LLERCP和GWAS信號(圖6b),這個結果也比其他隨機選擇的基因高。LLERCP的富集表明LLERCP可能能夠解釋玉米表型變異的現象。
 
 
圖6 表型變化相關基因在產生circRNA和含有LLERCP的基因中富集。具體說明見文中。
 

         如果circRNA與表型變異相關,那么猜測在玉米自交系中,在性狀相關的基因上,LLERCP可能有存在或者缺失多態性,并且這種變異與表型變異相關。為了驗證這種假設,該課題組利用GRMZM2G089149(圖7a),這個基因與玉米的穗位高度性狀顯著相關,并且含有LLERCP和能夠產生circRNA(circ1690)。該課題組對43個自交系的GRMZM2G089149基因的LLERCP中的變異進行了分析(圖7b)。GRMZM2G089149有14個外顯子和13個內含子,其中第3-11個外顯子產生了circ1690,并且第2和11個內含子上含有LLERCP序列。雖然第2個內含子上含有兩條LLE序列,但是他們在43個不同的自交系中共分離。因此,只有一個LLERCP可以形成。GRMZM2G089149編碼了一個未知蛋白,但是含有UVB光合作用域,這個作用域與植物的營養生長和穗位高度相關。基因組擴增和qRT-PCR分析顯示,幾乎所有(除去一個)含有LLERCP的GRMZM2G089149基因的自交系能夠產生circ1690,并且含有LLERCP產生的circ1690表達量顯著高于沒有LLERCP產生的circ1690(圖7c)。這些結果表明,LLERCP的存在與否與circRNA的形成和積累相關。此外,circ1690的表達量與GRMZM2G089149的線性轉錄本表達量呈負相關(圖7d),這表明circ1690的表達可能會影響線性轉錄本的表達。更有趣的是,含有LLERCP的自交系的株高顯著高于不含有LLERCP的自交系(圖7e),這也與之前所提的假設一致(即LLERCP的存在或者缺失影響玉米穗位高度性狀)。總而言之,這些結果提供了關于轉座子通過circRNA形成在表型變異中發揮功能作用的機制的有趣線索。
 
 
圖7 在玉米自交系中,LLERCP的存在與否與穗位高度的變化相關。具體說明見文中。
 
 

小結

         1、環狀RNA(circRNA)是共價閉合的RNA分子。最近的研究表明,circRNA可以來自轉座子的轉錄物。鑒于玉米基因組中轉座子的普遍存在,以及由轉座子引起的大量的基因組變異,研究人員假設玉米中的轉座子可能參與circRNA的形成并進一步調節表型變異。
         2、研究人員在B73幼苗葉上進行了環狀RNA高通量測序(circRNA-Seq),并且鑒定了2804個高可信度玉米circRNA,這些circRNA都展示出不同的基因組特征。
         3、綜合分析表明,circRNA的側翼區域中顯著富集著與重復序列LINE1-like element(LLE)及其反向互補對(LLERCP,LLE和LLE的反向互補序列形成反向互補對)相關的序列。有趣的是,隨著LLERCP數量的增加,circRNA的積累發生變化,而同位點產生的線性轉錄物的積累減少。此外,在與表型變異相關的基因座中富集著能夠產生LLERCP介導的circRNA的基因。這些結果表明,LLERCP介導的circRNA可能參與表型變異的調節。
         4、此外,研究人員發現LLERCP的存在或者缺失與circ1690的表達差異相關,并且與玉米的穗位高度性狀相關,這可能由于circRNA和線性轉錄物之間的相互影響而產生的。研究人員對玉米circRNA的首次研究揭示了轉座子調節轉錄組學層面和表型變異的潛在新途徑。
 
 

服務熱線
025-58742321
地址:江蘇省南京市高新區惠達路9號南自園區C樓101
聯系人:丁先生
郵箱:project@jggene.com
手機:025-58742321
台湾佬中文娱乐综合网2,国产偷国产偷亚洲清高9714,免费的国产日产a在线播放,国产小视频福利合集在线观看,欧美香蕉有线在线播放,欧美日韩国产专区一区