科學家開發環形RNA定量和剪接體轉換識別新方法

中科院之聲 發佈 2020-01-10T03:42:29+00:00

趙方慶團隊在前期的工作中建立了環形RNA識別、轉錄本組裝、可變剪接檢測及定量等方法,相關工作發表在GenomeBiology、Nature Communications 、Briefings in Bioinformatics 、Trends in Genetics 、Genom

2020年1月3日,中國科學院北京生命科學研究院趙方慶團隊在《自然-通訊》(Nature Communications)雜誌上發表題為Accurate quantification of circular RNAs identifies extensive circular isoform switching events 的文章。該研究開發了環形RNA定量和差異表達分析的新方法——CIRIquant。與常用的環形RNA分析軟體相比,CIRIquant可以更準確對環形RNA轉錄本進行識別和定量,並為環形RNA的差異表達分析提供了便捷的一站式分析工具。

環形RNA是一類在真核生物中廣泛存在的具有特殊環狀結構的非編碼RNA分子。已有文獻表明,在生物體內,環形RNA有著miRNA海綿、RBP海綿以及翻譯短肽等多項功能,在許多生物學過程中發揮著重要作用。目前研究表明,大部分環形RNA來源於蛋白編碼基因的外顯子區域。在pre-mRNA剪接的過程中,除典型的內含子剪接事件外,還可能會發生5』端到3』端的反向剪接事件,從而形成環形RNA。因此,剪接產物中環形RNA所占比例是環形RNA分析的重要指標之一,具有高成環比例的環形RNA分子,可能具有更加重要的生物學功能。同時,同一基因內部也可能產生多種不同的環形RNA,基因內對環形RNA產生位點的使用偏好,也在一定程度上反映了轉錄過程對環形RNA產生的調控。因此,環形RNA轉錄本水平的準確定量,是目前環形RNA分析的重要基礎。

在此基礎上,趙方慶團隊開發了CIRIquant。根據該算法鑑定出的環形RNA成環位點信息,研究人員重構了具有反向剪接特徵的環形RNA參考序列,簡化了複雜的反向剪接位點比對問題,並結合測序讀段比對到參考基因組和環形序列的結果,篩選出了高置信度的來自環形RNA的讀段,解決了目前環形RNA識別和定量方法中準確度低和假陽性率高的問題。作者在模擬數據和真實轉錄組數據中,對多種常用環形RNA識別軟體的表現進行了綜合評估,發現該研究中開發的方法在環形RNA表達量和成環比例的計算中,均取得了最佳的結果。

接著,研究團隊還通過統計模型,對環形RNA建庫過程中常用的RNase R處理效率進行了擬合和校正,從而在RNase R處理後的樣本中,消除了RNase R處理步驟引入的偏差,取得了更準確的定量結果。在此基礎上,該團隊還對環形RNA的差異表達計算方法進行了改進,提出了新的評估表達水平和剪接傾向變化程度的打分方法。

利用上述方法,研究人員在三個剪接因子較低的HeLa細胞和20對肝癌-癌旁樣本中,發現了兩類線性-環形比例和成環位點使用偏好發生變化的環形RNA。這兩類環形RNA在成環比例以及基因內成環位點使用水平上具有非常顯著的改變,反映了環形RNA轉錄過程以及轉錄後水平調控情況的變化。此外,在阿爾茲海默症以及腎細胞癌的樣本中,研究人員也發現了這兩類事件的廣泛存在,說明這兩類環形RNA可能擁有更加重要的生物學功能。

該研究在轉錄組數據中實現了環形RNA的準確識別和定量,並對環形RNA差異表達分析方法進行了改進,提供了便捷的分析流程,為後續具有潛在功能的環形RNA篩選提供了重要的方法學工具。

該工作由趙方慶課題組的研究生張金陽、陳帥和楊靜雯完成,並得到了科技部重點研發計劃和國家自然科學基金委及中科院的經費支持。趙方慶團隊在前期的工作中建立了環形RNA識別、轉錄本組裝、可變剪接檢測及定量等方法,相關工作發表在Genome Biology(2015)、Nature Communications (2016,2020)、Briefings in Bioinformatics (2017)、Trends in Genetics (2018)、Genome Medicine(2019)和Cell Reports(2019)。這些研究豐富了人們對環形RNA的組成及結構的認識,為深入了解這一嶄新類型的非編碼RNA分子提供了重要工具和數據支持。

圖1. CIRIquant算法流程

圖2. RBP介導的線性與環形轉錄本的競爭性剪接

來源:中國科學院北京生命科學研究院

關鍵字: