華大基因:生命大數據「算力引擎」再發力 30X WGS信息分析僅需15分鐘

同花順財經 發佈 2020-01-17T21:28:41+00:00

17日,華大基因旗下子公司華大科技在其官方微信正式發布:被譽為生命大數據時代「算力引擎」的BGIOnline,目前成功實現一個30X WGS的基因拼裝、排序、去重、變異檢測全流程,僅需15分鐘。經過實際測試,整套方案在15分鐘內完成了 8組30X WGS 樣本二級分析處理。

再創紀錄!

17日,華大基因旗下子公司華大科技在其官方微信正式發布:被譽為生命大數據時代「算力引擎」的BGI Online,目前成功實現一個30X WGS(人類全基因組測序)的基因拼裝、排序、去重、變異檢測全流程,僅需15分鐘。

該方案相比經典流程可達120倍加速,相比目前全球最快的FPGA/GPU方案仍能提速2-4倍。通過雲計算對基因數據進行分析,大大縮短疾病風險檢測或確定治療方案的時間,這將為健康產業提供高效的解決方案,並對行業的加速發展提供強有力的支撐!

雲端實現大規模彈性調度計算

圖1 WGS分析過程示意圖

基因計算所面臨的挑戰不同於常規計算,大數據生信分析平台需要具備 PB 級的數據處理能力:存儲與壓縮、清理及管理、低成本保存的能力;快速、安全的雲端分發共享;基因數據的安全隱私保護、大規模數據挖掘;按需調度和彈性擴容等。

此次方案由華大DNBSEQ自主測序儀、BGI Online混合雲架構、阿里雲容器服務ACK/AGS基因服務以及賽樂基因GPU加速算法的深度融合而成。其中,華大基因聯合阿里雲的整體技術架構為雲原生容器混合雲,實現雲上雲下資源一體,跨地域集群統一管理。憑藉雲端的自動伸縮特性,實現大規模彈性調度計算。

在使用上,該方案用戶無需關心基因數據處理過程中的計算資源、處理邏輯、數據緩存等細節,只需將下機數據(FASTQ文件)上傳至OSS,以及授權Bucket給AGS服務,即可高效、快速完成整個數據分析流程,並將結果數據上傳到用戶期望的存儲空間。

這套端到端解決方案,無縫銜接測序平台和基因雲平台,全面支持包括DNBSEQ系列測序儀在內的多種測序平台,可按需定製分析流程,交付靈活性極高。

速度更快,精度更高,成本更低

相比同類產品,它在計算速度、精準度、成本、易用性、與上游測序儀的整合度上具有極大優勢,在2020年,新的WGS交付方案將會助力基因科研與臨床檢測再上一個新台階。

經過實際測試,整套方案在15分鐘內完成了 8組30X WGS 樣本二級分析處理。在保證精度的前提下,實現15分鐘對7200億鹼基拼裝、排序、去重、變異檢測,完成基因檢測全流程120倍加速。且經過NA12878測試數據集與金標準VCF比較,二級分析的精度高於或等於BWA-0.7.17/GATK 4.1.3的數據產出,SNP 精度到達99.80%!

圖2 實測30X WGS N12878數據加速效果

圖330X WGS軟體加速一致性

同時,阿里雲ACK/AGS提供雲上PaaS加速能力,以混合雲方式協助華大基因完成自主測序儀大批量下機數據分析的近實時交付,可有效降低分析計算成本,縮短該環節交付周期。

加速解碼生命進程

此前,線下進行單個樣本的WGS分析通常需要70+小時;2016年底,BGI Online(國際版)實現17小時完成100個WGS分析;2017年底,時間降至120分鐘;到如今攜手阿里雲,創下15分鐘完成1個WGS的新紀錄,BGI Online再次刷新了全基因組分析的速度極限。

隨著精準醫學人群隊列項目的陸續啟動,我國自主可控的基因測序與分析平台顯得愈發重要。BGI Online將在未來繼續完善平台功能,為用戶提供完整、全面、友好的功能體驗,使生物信息領域的研究更簡單高效。

解碼未知,丈量生命。科技的每一小步,都會成為人類前行的一大步。華大基因及BGI Online將繼續攜手合作夥伴,共同為基因事業貢獻力量。

註:人類全基因組測序(Whole Genome Sequencing,簡稱WGS)是利用高通量測序技術對人類不同個體或群體進行全基因組測序,並進行生物信息分析的方法。癌症和遺傳疾病的深度解析往往需要對大量樣本進行WGS測序與分析,而且對WGS數據的挖掘還能發現非常多極具價值的遺傳多樣性信息。一個人類全基因組有30億鹼基,一個30X的WGS測序數據量大約在100G。

(責任編輯:李偉)

來源: 中國網財經

關注同花順財經微信公眾號(ths518),獲取更多財經資訊

關鍵字: