華人學者開發空間轉錄組數據分析新方法 -- SPARK

bioart 發佈 2020-01-28T16:36:33+00:00

責編| 兮2020年1月27日,美國密西根大學、生物統計系周翔副教授課題組在Nature Methods雜誌上發表方法研究型長文「Statistical analysis of spatial expression patterns for spatially resolved

責編 | 兮


2020年1月27日,美國密西根大學、生物統計系周翔副教授課題組(https://www.xzlab.org;孫世權博士為第一作者,朱佳強為共同第一作者)在Nature Methods雜誌上發表方法研究型長文「Statistical analysis of spatial expression patterns for spatially resolved transcriptomic studies」,提出了一種空間轉錄組數據模式表達基因識別的新方法SPARK。



該方法利用廣義線性混合模型直接對空間轉錄組測序的原始數據(Counts)進行建模,通過懲罰擬似然(Penalized Quasi-Likelihood)、限制性最大似然估計方法(Restricted Maximum Likelihood, REML)對該模型進行求解,採用了一種新的統計量整合規則(Cauchy Combination Rule)來計算統計P值。相比近期提出的SpatialDE和trendsceek這兩個方法,SPARK直接對測序原始數據建模(Count-Based),避免對counts數據標準化帶來的信息損失;能有效地控制第一類錯誤(Type I Error),避免對假陽性模式表達基因的甄別; 具有較高的統計檢驗效能(Statistical Power),避免一些與性狀相關的模式表達基因的丟失。SPARK所分析的空間轉錄組數據不依賴於測序技術本身,該模型能考慮細胞大小(Cell Size)對基因表達水平的影響,能控制在實驗過程中不期望的混雜因素或批次效應(Cofounding Factors or Batch Effects)對模式表達基因識別的影響,是空間轉錄組測序數據一個快速、有效的分析工具。



本文通過設計大量的仿真實驗(Simulations)評估SPARK模型與算法的有效性和優劣性,通過四個公開實例數據驗證模型與算法的實用性。四個實例數據來自不同的物種、組織(小鼠嗅球,人類乳腺癌,小鼠下丘腦和小鼠海馬),來自三種不同的空間轉錄組測序技術(Spatial Transcriptomics, seqFISH和MERFISH)。以人類乳腺癌為例,SPARK識別的差異表達基因是SpatialDE的三倍多,多識別的這些基因本文通過三種不同的方式驗證其生物意義,驗證結果顯示其與人類乳腺癌疾病呈強相關性。例如基因ERBB2(P value = 2.9x10-6), HLA-B(P value = 5.6x10-17)EEF1A1(P value = 3.0x10-17)等。


總之,本文提出了一個快速、有效的新方法SPARK,通過數值模擬和實例分析表明該方法可以很好地控制第一類錯誤且具有較高的統計功效。SPARK的R軟體包可以從Zhou Lab網站https://www.xzlab.org/software.html 或 CRAN 下載、安裝;R軟體安裝方法及示例數據分析詳細說明文檔見網站https://xzhoulab.github.io/SPARK ;本文測試的實例數據,實驗分析代碼可從網站https://github.com/xzhoulab/SPARK-Analysis 下載。




博士後招聘

另外,周翔老師課題組目前有一個博士後職位,該職位側重於開發用於全基因組關聯研究或功能基因組測序研究中的高維生物學數據的統計方法和計算工具。感興趣的申請者可發簡歷(CV)至郵箱xzhousph@umich.edu

一、招聘研究方向但不限於

1.單細胞測序數據的建模、分析與研究

2.亞硫酸氫鹽測序,RNA-seq或其他功能基因組學測序研究中的差異表達分析

3.利用基因型或測序數據估計SNP遺傳力和表型預測

4.利用基因型,基因表達和其它組學數據進行整合分析

二、應聘條件

1、具有統計學、應用數學、計算機、自動化、生物信息學等研究背景

2、以第一作者身份在國際重要學術刊物上發表過研究論文,並且具有較強的英文寫作與閱讀能力

3、具有良好的溝通能力和團隊協作精神,努力勤奮,身心健康,樂觀向上


原文連結:

https://www.nature.com/articles/s41592-019-0701-7

關鍵字: