在2021三月19號這天有場關於DRAGEN 3.8版本的說明演講
這次更新有許多新功能,尤其是加入許多人期盼的壓縮技術
本次更新有下面幾個亮點
1. ORA壓縮技術, 2.Biomarkers, 3.HLA typing, 4.DNA amplicon
DRAGEN ORA compression
使用情境:Novaseq數據下機fastq.gz透過DRAGEN ORA進行壓縮,ORA壓縮檔可直接進行二級分析或者備份 雖然壓縮需要成本,但解壓縮是免費 // ORA解壓縮軟體載點
ORA技術可達5倍的壓縮率,原理如下
DRAGEN ORA lossless compression is specifically designed for genomics data. The DNA sequence is compressed using a reference-based method: reads are mapped on a reference genome using an ultra-fast mapping scheme devised for compression. A compact binary format is used to encode reads as positions and a list of differences, followed by an entropy coder. Quality scores are encoded in a lossless way using a range encoder and context models adapted to the different types of quality schemes.
更細節資料可以看官方網站
在DRAGEN上壓縮及解壓縮的時間比傳統pigz快三倍
壓縮帶來的好處
節省80%儲存空間
一個拇指碟就可以存WGS
傳輸時間節省80%
過去Novaseq 一個run 48個WGS要傳輸需要一周,透過壓縮數據,傳輸在1.5天內即可完成
舉一個例子,過去要從台北傳WGS數據到國網中心最快方式是帶著硬碟坐上高鐵到新竹,而且還要找時間歸還硬碟; 而壓縮過後WGS透過網路傳輸,同樣台北到新竹交通時間時間可以傳兩份WGS,而且不限工作日及上班時間,可自動完成
壓縮成本:壓縮額度另外計算,不會用到原本的額度
Biomarkers: TMB and MSI
TMB 是免疫治療重要的生物標誌 原則上是計算造成蛋白質變異的突變佔的比例 TMB= #nonsynonymous calls / coding region (in MB)
MSI 也是免疫治療重要的生物標誌 原則上是看微衛星區域是否有repeat變化的比例
DRAGEN可以很精準地計算MSI,與做實驗的結果一致
DRAGEN做的二級分析跟TSO500自帶分析的差異
TSO500 analysis是針對TSO500 panel的優化分析
好處1: 不用成對樣本就能完成兩種Biomarker的計算,樣品需求及成本可以下降
好處2: TSO500自帶原廠測試的數值標準,不用自己花大錢建立標準資料庫
因此TSO500是大panel中分析方案最優雅及全面的最佳選擇
HLA typing
研究藥物基因體的學者有福了,這部分也是我最期待功能,之前版本推出CYP2D6 typing,但怎麼可以漏掉HLA typing呢?
這次版本更新就補上這個功能,其準確率跟效率都相當令人滿意
提升CYP2D6準確度
在212已知結果樣品中,新版本的準確度有不小提升
提升結構變異準確度
結構變異準確度也有優化,準確度是Manta的兩倍以上
Single Cell RNA-seq
scRNA-seq但要降低成本時,可以採取事後demutiplex的分析 首先知道所有樣品的基因型,再合併樣品建一個scRNA-seq文庫 利用DRAGEN的強大算力,可以根據樣品基因型做demutiplex
雲端BaseSpace上新功能
DRAGEN Single Cell RNA - Single sample and aggregate reports - 雲端上就能享受高品質單細胞分析
DRAGEN Amplicon - Easy usage of new pipeline options for DNA amplicon panels - 這是為amplion技術的特製分析方案
結論
新版本DRAGEN提供不少新功能 請有興趣的用戶可以上Webinar上看完整說明 演講錄影
Comments