top of page
搜尋

illumina CoV-2 NGS Data tool kit

目的: 1. 檢測目標病原體 2. 探索未知病原體


## 前處理 - Shotgun - TruSeq Stranded Total RNA Gold - Stranded specific 可以加強比對專一性 - 針對total RNA建庫 - Target enrichment - Illumina Respiratory Virus Oligo Panel - 7,800個probe, 42種呼吸道病毒 - 不只含DNA,RNA病毒,也包括Covid-19 - 常見腺病毒、冠狀病毒、鼻病毒、A流、B流、新型流感(H1N1, H7N9...) - 更多流程細節

## DRAGEN RNA Pathogen Detection basespace app v3.5.11 目的:檢測目標病原體 DRADON BioIT platform 原本就有轉錄體流程 借助fusion gene 偵測的分析,客製化專屬COVID-19病毒偵測流程 DRAGON bioIT 平台藉由硬體加速實現精準偵測病毒序列 三分鐘可以分析1億對RNA seq reads

基本Input: 1. fastq 序列 2. Reference sequence 2.1 可選:HG38+illumina Respiratory Virus Panel

2.2 可選:HG38+Respiratory Viruses from the Seattle Flu 進階input: 1. 客製化參考序列(需經DRAGEN Reference Builder處理) 2. 客製化參考序列專屬目標區域(BED檔) 3. K-mer Reference FASTA or 自行準備k-mer清單

Output: 1. Summary Report 2. 樣本中病毒比例 3. Consensus FASTA 4. KMer Plot 5. 病毒基因體上Coverage Plot 結果截圖: 樣本為SRR11247075,SRR11241255,SRR11241254 皆為Nextera XT prep library,在Miseq上機,單邊定序 Summary report上顯示三樣本在不同病原菌中的比例,三個樣本在SARS-CoV2病毒上表達遠高於其他病毒

單一樣本報告中顯示SRR11247075樣本,SARS-CoV2病毒表達高

Consensus FASTA中顯示定序結果中一致的序列 簡單來說,在alignment過後,根據同位置上序列多數決來決定此位置的鹼基 由於病毒序列有30Kb,沒有訊號區域會以N表示







KMer Plot
這個分析是比對**給定Kmer清單**
kmer相當於**RT-PCR中的probe**,是具有鑒別力的短序列
由於基因上存在類似序列,這樣的序列會是分析的背景值
當訊號"介於有跟沒有之間"時,我們需要額外資訊
使用Kmer比對好處是我們只比對具有鑑別力的序列進行比對

感染者檢體






肝癌WGS數據比對結果(未感染)







根據 illumina部落格 專一性的Kmer清單作為分析材料,可以很有效的區分正常人及病人

利用具有專一性的kmer序列可以增加檢測信心,降低偽陽性 Coverage plot NGS比對病毒結果 MN908947.3為SARS-CoV-2

## DRAGEN Metagenomics Pipeline basespace app v3.5.11 目的:探索未知病原體 過去去除宿主(人類)基因體是Metagenome的重要問題 DRADON BioIT platform 具有快速比對宿主基因體的功能 去除宿主的序列後,其餘序列借重於強大Kraken2演算法來分析資料庫中各物種的比例 目前,Kraken2是研究人員在全球範圍內研究metagenome,微生物組和病毒基因組學的首選工具 基本Input: 1. fastq 序列 2. Kraken資料庫 2.1 [Kragken 計畫] 2.2 [可選]MiniKraken2 2.3 [可選]Extended Kraken2 3. 參考序列 3.1 [可選]UCSC,Ensmble/hg19,hg38 基本Output: 1. Aggregate summary 2. Taxonomy composition

結果截圖: Aggregate Summary 顯示同批樣本各菌種表達 這是基於資料庫中對到具有代表性Kmer序列的表達 Severe acute respiratory syndrome conavirus 2為SARS-CoV-2序列

## 總結: 這邊提到RNA Pathogen Detection及Metagenomics Pipeline

若是針對已知病原菌檢測,我會建議使用RNA Pathogen Detection 因為這是針對SARS-CoV-2的流程,其中的Kmer分析可以降低偽陽性 即使在alignment中看到低表達訊號,Kmer分析可以辨別真實訊號 此外這個分析具有的參數比較多

對分析有深度需求的使用者會比較喜歡這樣的工具 若是想知道SARS-CoV-2以外的感染源可以採取Metagenomics Pipeline Kraken的Kmer資料庫分析很適合用於了解其他感染源 ## 了解更多SARS-CoV-2應用(application note) Enrichment workflow for detecting coronavirus using Illumina NGS systems Detecting coronavirus with the Respiratory Virus Oligo Panel Comprehensive workflow for detecting coronavirus using Illumina benchtop systems

Comments


bottom of page