文獻解讀

lncRNA測序案例解讀-農學

返回列表
2019-01-21 15:11    編輯:admin
植物中轉座子促成的抗性相關的基因間區長非編碼RNA(lincRNA)
Transposable elements (TEs) contribute to stress-related long intergenic noncoding RNAs in plants
The Plant Journal (2017) 90, 133–146
doi: 10.1111/tpj.13481
 

背景

        通過高通量測序技術,非編碼RNA已在植物和動物轉錄組中被廣泛研究。這些非編碼RNA中,越來越多的基因間長非編碼(lincRNA)在多細胞生物中為人所知,但是大部分lincRNA的起源和功能仍有待探索。在許多真核基因組中,轉座子(TE)廣泛分布,通常占植物和動物基因組的大部分,但是TE對lincRNA的貢獻在很大程度上是未知的。
 
 

主要材料方法

1. 材料與數據
        擬南芥、水稻和玉米RNA-Seq,包括三個生物學重復(GSE76798)
 
2. 主要分析流程

        (1)全基因組lincRNA的鑒定(具體流程見圖1);
        (2)lincRNA中TE的含量、種類等特征;
        (3)擬南芥中TE-lincRNA的表達譜特征;
        (4)轉基因驗證TE-lincRNA對非生物脅迫的響應;
        (5)ddm1突變體植株中lincRNA的特征。
 

主要結果

1、三種植物物種中轉座子相關lincRNA(TE-lincRNA)的全基因組鑒定
        為了系統地鑒定TE-lincRNA,該課題組對三個物種的兩周大幼苗進行了鏈特異性轉錄組測序。由于在人類和小鼠中早已報道反轉錄轉座子來源的lncRNA的表達水平很低,因此該研究組在擬南芥、水稻和玉米中測定了高深度的轉錄組序列,分別來自每個物種的三個生物學重復,包括66、173、256百萬對雙端測序讀序。該課題組還建立了一個鑒定TE-lincRNA的流程(圖1),其中包括三個關鍵步驟。第一,使用TopHat2將讀序比對到三個物種相應的參考基因組上,并且使用Cufflinks軟件組裝每個物種中的轉錄本。第二,保留長度大于200nt并且與已知基因沒有重疊區域的轉錄本,此外還要刪除那些可能編碼多肽或者蛋白的轉錄本,包括與SWISSPROT數據庫中序列相似的轉錄本,和內部開放閱讀框(ORF)大于100aa或者尾部開放閱讀框大于50aa的轉錄本。通過這步篩選,擬南芥、水稻和玉米中分別還有205、1229、773個轉錄本(也就是lincRNA)符合要求(表1)。第三,部分與TE位點重合但是不完全在TE位點內的lincRNA就是TE-lincRNA。最后,該課題組在擬南芥、水稻和玉米中分別鑒定到47、611和398個TE-lincRNA(表1)。水稻和玉米中的TE-lincRNA數量比擬南芥中多與各物種基因組上的TE位點數量有關(表1)。
        該課題組還比較了TE-lincRNA和不含有TE的lincRNA(也就是non-TE-lincRNA)的基本特征。TE-lincRNA和non-TE-lincRNA在三個物種中的長度分布類似,TE-lincRNA的平均長度顯著長于non-TE-lincRNA,在三個物種中分別是829nt對應773nt(擬南芥,P值0.01347,Wilcoxon秩和檢驗)、1125nt對應834nt(水稻,P值小于2.2e-16,Wilcoxon秩和檢驗)、1343nt對應753nt(玉米,P值小于2.2e-16,Wilcoxon秩和檢驗)。三個物種中的大部分lincRNA,包括TE-lincRNA和non-TE-lincRNA都只有單個外顯子。擬南芥和水稻中TE-lincRNA和non-TE-lincRNA的平均外顯數量沒有顯著差異,而玉米中TE-lincRNA的外顯子數量稍顯著低于non-TE-lincRNA(擬南芥1.6對1.5,P值0.2507;水稻1.6對1.7,P值0.1432;玉米1.3對1.4,P值0.007197;Wilcoxon秩和檢驗)。這些結果揭示TE可能導致了lincRNA轉錄長度的延長,但是在水稻和玉米中并不會增加剪接復雜性。此外,該課題組還通過利用Rfam數據庫評估了TE-lincRNA和non-TE-lincRNA中的RNA基序的分值,發現大多數TE-lincRNA和non-TE-lincRNA都不含有或者只含有一條RNA基序,TE-lincRNA和non-TE-lincRNA的RNA基序數量之間沒有顯著差異。TE-lincRNA和non-TE-lincRNA在蛋白編碼基因的5’或者3’端的5kb區域都顯示出位置分布的偏向性。一些TE-lincRNA和non-TE-lincRNA的表達量與他們鄰近的基因的表達量呈現顯著正相關或者負相關。該課題組根據編碼和非編碼基因的表達量建立了共表達網絡,其中包括含有16320個編碼基因、77個lincRNA(包括12個TE-lincRNA)的21個共表達子網絡。TE-lincRNA在脅迫響應子網絡中與多個編碼基因有很高的表達相關性。
 
 
圖1 從RNA-Seq數據中鑒定轉座子相關lincRNA的流程
 
表1 該研究鑒定的lincRNA匯總
 
 
 
2、TE對lincRNA的貢獻的驗證
        植物中的TE主要分成兩類:第一類通過RNA中間體進行轉座(復制和粘貼機制),第二類通過DNA中間體進行轉座(切斷和粘貼機制)。根據序列相似性,這兩類TE還可被分為很多家族,并且每一個TE家族都有它們自己的功能和進化歷史。因此,該課題組研究了不同TE家族對lincRNA的貢獻。在擬南芥中,超過40%的TE-lincRNA含有28個RC/Helitron TE(圖2a)。在水稻中,大多數TE-lincRNA分別含有424個微型反向重復轉座子(MITE)、438個未分類的轉座子和335個未分類的反轉錄轉座子。而在玉米中,對于自交系品種B73中的lincRNA,Gypsy、LTR和Copia反轉錄轉座子是三種最主要的貢獻者(圖2a)。由于不同基因組中不同TE的拷貝數不同,因此該課題組采用富集分析來檢驗不同TE對lincRNA的貢獻的顯著性。結果(圖2b)顯示,擬南芥中的短散布元素(SINE)對lincRNA貢獻最顯著,水稻中貢獻較多的是未分類轉座子、未分類反轉錄轉座子、Ty3-gypsy和著絲粒特異的反轉錄轉座子,玉米中最顯著貢獻的是LTR和長散布元素(LINE)。這些結果表明,在不同植物物種中不同TE家族對lincRNA有不同的貢獻程度。與此研究中用到的兩種作物相比,擬南芥幼苗中的lincRNA更傾向于TE家族的缺失。
 
 
圖2 擬南芥、水稻和玉米中lincRNA內部不同TE家族的富集情況
 

        此外,該課題組還發現在水稻和玉米中,大部分lincRNA只含有一個TE,而有些TE-lincRNA可含有多達18甚至43個TE。含有多個TE的TE-lincRNA的長度長于那些只有一個TE的lincRNA。此外,多數lincRNA中TE的含量較高,特別是在玉米中。該課題組還分析了水稻和擬南芥中TE-lincRNA的保守性。結果(圖3)顯示,做保守的原件是基因,最不保守的是TE;相比于TE,TE-lincRNA更加保守;TE-lincRNA和non-TE-lincRNA的保守水平相似。這些結果與先前觀點大體一致,即lncRNA中的TE在進化上受功能或結構限制。
 
 
圖3  擬南芥和水稻中TE-lincRNA、non-TE-lincRNA、基因、TE和基因間區的保守性水平
 
3、擬南芥中TE-lincRNA的表達圖譜

        該課題組通過鏈特異性RT-PCR在擬南芥、水稻和玉米的幼苗中驗證TE-lincRNA的表達。他們在擬南芥中選擇了11個候選進行驗證,結果顯示這些候選都表達(圖4a)。同樣在水稻和玉米中,各選的三個候選TE-lincRNA也都被證實表達(圖4bc)。為了評估TE-lincRNA在不同擬南芥組織中的表達水平,該課題組進行了數字PCR實驗。結果顯示,所有的TE-lincRNA在不同組織中表現出不同的表達模式。例如,lincRNA18980在根中高表達但是在花中幾乎不表達;TE-lincRNA3688、TE-lincRNA11344、TE-lincRNA15772在根、花和長角果中都低表達(圖5a)。此外,該課題組還使用公共RNA-Seq數據分析了205個擬南芥lincRNA在不同脅迫處理下的表達模式。與正常生長的環境相比,多數lincRNA,包括TE-lincRNA在5種不同脅迫條件下的表達模式不同(圖5b)。這些結果與先前的研究結果一致,也就是lncRNA的表達呈現組織特異性和時空特性。由于先前研究表明很多lncRNA與基因表達調控相關,因此該課題組還對候選TE-lincRNA和與它們鄰近的基因進行了表達相關性的研究。對于TE-lincRNA15772和TE-lincRNA19433,它們的表達與其鄰近基因的表達沒有相關性;然而TE-lincRNA11344的表達水平與其相鄰基因DPBF2的表達負相關(圖5c),這表明TE-lincRNA11344的可能功能是下調鄰近基因的表達量。
 
 
圖4  TE-lincRNA在三個物種中的表達驗證
 
 
圖5  TE-lincRNA的表達模式
 
4、擬南芥TE-lincRNA11195突變體誘導對脫落酸(ABA)的抗性

        為了研究TE-lincRNA在脅迫條件下的功能,該課題組在多個TE-lincRNA位點插入T-DNA產生突變體,并且在標準的實驗室條件下進行脫落酸處理后觀察表型。結果顯示,含有LTR的TE-lincRNA11195上兩個獨立位點的T-DNA插入表現出抗脫落酸的表型(圖6)。這兩個T-DNA插入的突變體(11195-1和11195-2)都導致TE-lincRNA11195無法被實驗發現(圖6a)。在沒有外源脫落酸的情況下,11195-1和11195-2突變體的幼苗與野生型相似(圖6b)。然而,添加外源脫落酸之后(20uM ABA),與野生型相比,突變體幼苗表現出顯著增強的抗性(圖6b),包括顯著伸長的主根和不十分顯著增長的地上部分鮮重(圖6c)。此外,該課題組還研究了TE-lincRNA11195在種子萌發方面的作用。lincRNA11195突變體在種子萌發階段對外源脫落酸表現出不敏感,并且在種子萌發后的幼苗發育階段也對脫落酸不敏感。
為了研究TE-lincRNA11195在轉錄調節方面的作用,該課題組使用RT-PCR在野生型和ABA不敏感突變體中評估TE-lincRNA11195的表達量。野生型Col-0中ABA處理12小時后,TE-lincRNA11195的表達量顯著上升。突變體幼苗中的ABA受體PYR1/PYL1/PYL4抑制了TE-lincRNA11195的轉錄。這些結果表明TE-lincRNA11195是相應ABA的。為了更加深入地研究TE-lincRNA11195在非生物脅迫反應方面的功能,該課題組檢測了不同脅迫條件下TE-lincRNA11195的表達量。除了ABA處理,鹽脅迫和低溫脅迫都影響著TE-lincRNA11195的表達量,但是并沒有影響臨近基因的表達量。隨后在種子萌發階段和種子萌發后幼苗發育階段進行鹽處理,發現lincRNA11195突變體中種子發芽率顯著高于野生型,這也說明TE-lincRNA11195與鹽脅迫相關。這些結果都表明,植物中TE-lincRNA11195與非生物脅迫響應相關。
為了鑒定TE-lincRNA11195的潛在靶基因,該課題組對正常和ABA處理的野生型和lincRNA11195突變體植株進行了RNA-Seq,并且使用一般線性模型(GLM)鑒定了ABA處理下野生型和lincRNA11195突變體的差異表達基因。結果發現有8個基因在lincRNA11195突變體中顯著上調,10個基因顯著下調(圖7a)。對100個差異表達基因進行GO富集分析,發現這些基因主要集中在“對水楊酸的刺激響應”(圖7b)。這100個差異表達基因分布在基因組的全部染色體上(圖7c)。為了闡明TE-lincRNA11195的具體功能,進一步的分子分析,例如發現RNA與蛋白互作關系的RIP實驗,是十分需要的。
 
 
 
 
圖6 擬南芥TE-lincRNA11195與脫落酸響應相關
 
 
圖7 擬南芥TE-lincRNA11195突變體的基因差異表達分析
 
 
5、ddm1突變體植株中TE-lincRNA的特征

        周圍環境的變化可能會引起染色質變化,并且植物中已證實有些lncRNA與生物或者非生物脅迫響應相關。因此,該課題組對ddm1突變體中lincRNA的表達量和染色質狀態進行了研究。染色質重塑因子DDM1的突變能夠改變DNase I超敏(DH)位點的分布,這些位點與RNA聚合酶II綁定位點密切相關。該課題組對生長兩周的ddm1突變體幼苗進行轉錄組測序。結果發現,在ddm1突變體中發現特異的轉錄本,并且也發現了TE-lincRNA和non-TE-lincRNA(圖8a,表1)。ddm1突變體中發現的TE-lincRNA與野生型中發現的差不多,盡管如此ddm1中發現的TE-lincRNA和non-TE-lincRNA相對較多(表1)。該課題組還在ddm1中發現387個特異的lincRNA,其中192個與DH位點重合,這表明這些特異的lincRNA可能是由于染色質狀態改變而產生的。隨后,通過ddm1純合植株與野生型雜交,并且通過交叉雜交F1和F2代產生的雜合子幼苗,對這些特異性lincRNA進行了遺傳研究(圖8b)。有趣的是,這些lincRNA可以在雜合子F1代幼苗中檢測到(圖8c),并且F2代中的表達與DDM1基因型無關(圖8c)。此外,這些ddm1特定的lincRNA在有些ddm1純合子中沒有表達,說明lincRNA的遺傳可能是不符合孟德爾遺傳定律的(non-Mendelian)。
 
 
圖8  ddm1突變體植株中lincRNA的特征
 

小結

        通過使用鏈特異性RNA測序,該課題組在擬南芥、水稻和玉米中分析了lincRNA的表達模式,分別鑒定了47、611和398個與TE相關的lincRNA(TE-lincRNA)。與DNA轉座子相比,TE-lincRNA更常來自反轉錄轉座子。由于水稻和玉米基因組中的反轉錄轉座子拷貝數都很多,因此TE-lincRNA的數量也很多。該課題組通過鏈特異性RT-PCR驗證了這些TE-lincRNA的表達,并且在鹽、脫落酸和低溫處理后發現這些TE-lincRNA的組織特異性和應激響應。對于擬南芥TE-lincRNA11195,突變體對ABA的敏感性降低,與野生型相比,突變體具有較長的根和較高的地上部分鮮重。最后,通過改變擬南芥染色質重塑突變體ddm1中的染色質狀態,特異性lincRNA,包括TE-lincRNA,能夠在前述的未轉錄區域轉錄并且在后代中遺傳。該課題組的研究結果不僅證明了TE相關lincRNA在植物非生物脅迫反應中起重要作用,還發現lincRNA和TE-lincRNA可能能夠作為真核生物中的適應性庫。
 
 

服務熱線
025-58742321
地址:江蘇省南京市高新區惠達路9號南自園區C樓101
聯系人:丁先生
郵箱:project@jggene.com
手機:025-58742321
台湾佬中文娱乐综合网2,国产偷国产偷亚洲清高9714,免费的国产日产a在线播放,国产小视频福利合集在线观看,欧美香蕉有线在线播放,欧美日韩国产专区一区