系统评估测序平台与分(fēn)析软件对肿瘤Panel检测的影响
发布时间:
2024-04-15
浏览量:

文(wén)章梗概


近日,真迈生物(wù)与合作(zuò)单位上海交通大學(xué)医(yī)學(xué)院附属第一人民(mín)医(yī)院在Frontiers in Genetics的Genomic Assay Technology版块上发表了题為(wèi)“Systematic comparison of variant calling pipelines of target genome sequencing cross multiple next-generation sequencers”的研究成果。该研究涵盖了两种肿瘤panel:TSO500和TargetSeq One;三种典型样本:FFPE,cf DNA(cell-free DNA) 和cell line;六个主流的NGS测序平台:NovaSeq 6000,NextSeq 550,MGISEQ 2000,GenoLab M,FASTASeq 300,SURFSeq 5000;五种常用(yòng)的突变分(fēn)析软件:HaplotypeCaller,Mutect2,SiNVICT,SNVer和VarScan 2。


背景介绍

靶向基因组测序(TS)是一种有(yǒu)效的高通量测序(NGS)方法,重点关注与疾病发病机制或临床相关的一组基因或靶点。它通过快速检测基因变异,為(wèi)临床医(yī)生提供参考,帮助他(tā)们解释病人基因图谱,并為(wèi)实施个性化的抗癌提供建议,极大地促进了肿瘤精(jīng)准化的发展。


TSO500是一个全面的靶标测序panel,涵盖超过8种癌症类型和523种癌症相关基因(1.94 Mb),用(yòng)于捕获FFPE标准品HD832,而TargetSeq One kit 用(yòng)于富集Twist cf DNA。本研究中(zhōng),6个乳腺癌和卵巢癌的cell line的panel数据来自于公(gōng)开数据库SRA。


*以下為(wèi)该研究成果解读

结果概要

TSO500靶向测序平台与软件间的比较

如图1a和1b所示,NovaSeq 6000,NextSeq 550,GenoLab M和FASTASeq 300四个测序平台在SNP和InDel检测的灵敏度(sensitivity)方面表现出几乎一致的结果,虽然SiNVICT和Mutect2在InDel的calling上有(yǒu)一些细微差异。FASTASeq 300测序仪基于SNVer和VarScan2软件,可(kě)以检出样本中(zhōng)全部的SNP和InDel突变(sensitivity=100%)。对于F-score和精(jīng)确度(precision),SNVer和VarScan2在SNP和InDel检测上也表现最好。此外,与ddPCR验证的真集相比,四个测序平台一致性都比较高,特别是使用(yòng)SNVer和VarScan2两个分(fēn)析工(gōng)具(jù)(1c)。


Pearson相关系数(r)热图(图1d)显示,在相同的软件下,不同测序平台呈现出相似的整體(tǐ)性能(néng)。随后,研究者比较了不同测序平台与分(fēn)析软件间高置信度变异的检测数量(图1e),发现所有(yǒu)数据集的一致性高达93.4%(198/212)。其中(zhōng),FASTASeq 300能(néng)检测到更多(duō)的特有(yǒu)突变,特别是通过SNVer和VarScan2两个软件。


综上,在SNP和InDel的突变检出方面,分(fēn)析软件间比测序平台间表现出的差异更大,FASTASeq 300在SNVer和VarScan2软件下表现更优。


一般而言,测序深度的增加有(yǒu)助于变异检测结果的重现和低频突变的检出,但需要更長(cháng)的分(fēn)析时间、更高的计算复杂度以及成本。研究者以突变检出表现最好的FASTASeq 300测序平台和SNVer以及VarScan2两款软件為(wèi)研究重点,比较了不同测序深度下变异检测时间、内存使用(yòng)、SNP和InDel检测灵敏度的差异,期望探索到保证高灵敏度的情况下所需的最低测序深度(图1f和1g,结果表明:至少500x的测序深度可(kě)以保证全部突变的检出,而VarScan2软件消耗内存更少,运行时间更短)。

科(kē)研论文(wén)丨系统评估测序平台与分(fēn)析软件对肿瘤Panel检测的影响

科(kē)研论文(wén)丨系统评估测序平台与分(fēn)析软件对肿瘤Panel检测的影响


TargetSeq One捕获的cf DNA测序平台与分(fēn)析软件的比较

对于cf DNA样本,软件SNVer和VarScan2在SNP和InDel检测方面表现出色。F-score, 召回率(recall)和精(jīng)确度都接近100% (Fig. S2),三个测序平台NovaSeq 6000,MGISEQ 2000和SURFSeq 5000结果也很(hěn)一致。

科(kē)研论文(wén)丨系统评估测序平台与分(fēn)析软件对肿瘤Panel检测的影响


cell line样本的分(fēn)析软件比较

通过下载公(gōng)开数据集,研究者获取到3个乳腺癌和3个卵巢癌的panel测序结果,并使用(yòng)上述五款软件进行突变检测,结果表明:SNVer和VarScan2两款软件同样表现更优,其检测结果最接近真集。


结论

不同测序平台在同一个分(fēn)析软件下,突变检测的一致性较好。三种类型的肿瘤样本,在突变检测方面,SNVer和VarScan2均表现最优。该项研究為(wèi)肿瘤靶向测序提供了一个benchmark。该研究使用(yòng)五种软件对三种典型的肿瘤样本进行变异检测的性能(néng)评估,也為(wèi)未来肿瘤变异研究提供了有(yǒu)价值的参考。


参考文(wén)献

Feng B, Lai J, Fan X, et al. Systematic comparison of variant calling pipelines of target genome sequencing cross multiple next-generation sequencers[J]. Frontiers in Genetics, 2023, 14: 1293974.



相关推荐