搜尋
  • Prisma_J

illumina CoV-2 NGS Data tool kit

目的: 1. 檢測目標病原體 2. 探索未知病原體


## 前處理 - Shotgun - TruSeq Stranded Total RNA Gold - Stranded specific 可以加強比對專一性 - 針對total RNA建庫 - Target enrichment - Illumina Respiratory Virus Oligo Panel - 7,800個probe, 42種呼吸道病毒 - 不只含DNA,RNA病毒,也包括Covid-19 - 常見腺病毒、冠狀病毒、鼻病毒、A流、B流、新型流感(H1N1, H7N9...) - 更多流程細節

## DRAGEN RNA Pathogen Detection basespace app v3.5.11 目的:檢測目標病原體 DRADON BioIT platform 原本就有轉錄體流程 借助fusion gene 偵測的分析,客製化專屬COVID-19病毒偵測流程 DRAGON bioIT 平台藉由硬體加速實現精準偵測病毒序列 三分鐘可以分析1億對RNA seq reads

基本Input: 1. fastq 序列 2. Reference sequence 2.1 可選:HG38+illumina Respiratory Virus Panel

2.2 可選:HG38+Respiratory Viruses from the Seattle Flu 進階input: 1. 客製化參考序列(需經DRAGEN Reference Builder處理) 2. 客製化參考序列專屬目標區域(BED檔) 3. K-mer Reference FASTA or 自行準備k-mer清單

Output: 1. Summary Report 2. 樣本中病毒比例 3. Consensus FASTA 4. KMer Plot 5. 病毒基因體上Coverage Plot 結果截圖: 樣本為SRR11247075,SRR11241255,SRR11241254 皆為Nextera XT prep library,在Miseq上機,單邊定序 Summary report上顯示三樣本在不同病原菌中的比例,三個樣本在SARS-CoV2病毒上表達遠高於其他病毒

單一樣本報告中顯示SRR11247075樣本,SARS-CoV2病毒表達高

Consensus FASTA中顯示定序結果中一致的序列 簡單來說,在alignment過後,根據同位置上序列多數決來決定此位置的鹼基 由於病毒序列有30Kb,沒有訊號區域會以N表示







KMer Plot
這個分析是比對**給定Kmer清單**
kmer相當於**RT-PCR中的probe**,是具有鑒別力的短序列
由於基因上存在類似序列,這樣的序列會是分析的背景值
當訊號"介於有跟沒有之間"時,我們需要額外資訊
使用Kmer比對好處是我們只比對具有鑑別力的序列進行比對

感染者檢體





肝癌WGS數據比對結果(未感染)







根據 illumina部落格 專一性的Kmer清單作為分析材料,可以很有效的區分正常人及病人

利用具有專一性的kmer序列可以增加檢測信心,降低偽陽性 Coverage plot NGS比對病毒結果 MN908947.3為SARS-CoV-2

## DRAGEN Metagenomics Pipeline basespace app v3.5.11 目的:探索未知病原體 過去去除宿主(人類)基因體是Metagenome的重要問題 DRADON BioIT platform 具有快速比對宿主基因體的功能 去除宿主的序列後,其餘序列借重於強大Kraken2演算法來分析資料庫中各物種的比例 目前,Kraken2是研究人員在全球範圍內研究metagenome,微生物組和病毒基因組學的首選工具 基本Input: 1. fastq 序列 2. Kraken資料庫 2.1 [Kragken 計畫] 2.2 [可選]MiniKraken2 2.3 [可選]Extended Kraken2 3. 參考序列 3.1 [可選]UCSC,Ensmble/hg19,hg38 基本Output: 1. Aggregate summary 2. Taxonomy composition

結果截圖: Aggregate Summary 顯示同批樣本各菌種表達 這是基於資料庫中對到具有代表性Kmer序列的表達 Severe acute respiratory syndrome conavirus 2為SARS-CoV-2序列

## 總結: 這邊提到RNA Pathogen Detection及Metagenomics Pipeline

若是針對已知病原菌檢測,我會建議使用RNA Pathogen Detection 因為這是針對SARS-CoV-2的流程,其中的Kmer分析可以降低偽陽性 即使在alignment中看到低表達訊號,Kmer分析可以辨別真實訊號 此外這個分析具有的參數比較多

對分析有深度需求的使用者會比較喜歡這樣的工具 若是想知道SARS-CoV-2以外的感染源可以採取Metagenomics Pipeline Kraken的Kmer資料庫分析很適合用於了解其他感染源 ## 了解更多SARS-CoV-2應用(application note) Enrichment workflow for detecting coronavirus using Illumina NGS systems Detecting coronavirus with the Respiratory Virus Oligo Panel Comprehensive workflow for detecting coronavirus using Illumina benchtop systems

Ⓒ 2020 BY PRISMA BIOTECH. ALL RIGHTS RESERVED.

瑞林生物科技股份有限公司

​Prisma Biotech Corporation