DNASTAR软件使用常见问答
您是否使用软件来组装NGS或长读取数据?如果是这样,您可能会对从长读取数据(“它真的比NGS好吗?”)到您的组装算法是否可信任等各种问题感到困惑。
在这篇文章中,将回答一些DNASTAR软件用户关于NGS和长读取序列组装的问题。无论您是对RNA-Seq的归一化方法感到好奇,还是想知道Lasergene基因组学软件如何识别质量不佳的测序数据,您都可以在下面找到答案。
长读取测序的优势有哪些,DNASTAR如何跟上新的测序技术?
在基因组和转录组工作流方面,长读取测序平台(PacBio、ONT)通常比其他测序平台提供了显著优势,从样品处理到数据分析快速完成,提供良好的准确性。长读取序列组装还有利于去新组装、结构变异分析、mRNA同构体分析、宏基因组学以及高变异区域分析。
DNASTAR积极与客户互动,了解他们如何将长读取技术应用于研究中。此外,我们的研发团队使用Zui新的数据集不断开发和改进比对算法和分析工具。
Lasergene的去新组装和参考引导(即有模板的)组装结果如何准确无误?
通过将去新组装的contigs与参考基因组进行比较(比对),我们评估去新组装的质量。这是通过像Mauve这样的基因组对基因组比对算法实现的,该算法可以在我们的MegAlign Pro应用程序中使用(图1)。
图1:使用选择了“Mauve”算法的MegAlign Pro创建的多重比对。
对于参考引导的组装,我们在可能的情况下使用“金标准”数据集来验证/验证我们的比对和变异调用流程。金标准数据的一个示例是“Genome in a Bottle联盟”数据中的人类基因组数据。
需要注意的是,虽然我们的基因组学软件通常使用现代的图形用户界面(GUI)运行,但我们也支持脚本。随着我们开发软件并添加新功能或算法,我们的质量控制团队使用脚本来对齐和分析各种数据集。我们还为Lasergene基因组学客户提供分析工具,以使用VCF和BED文件验证自己的比对和变异调用流程。
Lasergene软件如何识别质量不佳的测序数据并防止其对组装产生负面影响?
我们的比对算法有许多不同的机制,可以从高质量和不理想的输入序列数据中生成尽可能好的组装结果。其中一些机制包括比对严格度、向量修剪和污染物筛选设置,用户可以在项目设置期间自定义这些设置。
此外,我们的比对算法通过自动扫描和自动修剪,完整利用不达标的数据(图2)。这意味着只有Zui低质量的序列读数,即没有可用数据的读数,会从比对中删除。
图2:在SeqMan NGen中,Preassembly Options向导屏幕用于指定编辑修剪和污染物扫描选项。
Lasergene是否提供基因组浏览器,这些浏览器的用途是什么?不同类型的分析是否需要不同类型的浏览器?
许多研究人员使用基因组浏览器来比较来自一个或多个实验的不同类型的数据轨迹。基因组和转录组数据集提供了各种可视化工具。
浏览器处理常见文件,如序列比对(.bam文件)、变异轨迹(.vcf)和覆盖度轨迹(.wig)。然而,专用于一种数据源的分析工具并不一定与所有基因组浏览器兼容。例如,转录组分析可能包括用于mRNA同构体分析的Sashimi图/轨迹。火山图、散点图和热图通常用于差异基因表达分析,但可能需要除浏览器外的额外软件工具。
理想情况下,研究人员应在浏览器中同时具备多种数据分析工具,以及支持的数据表格、图表,可以同时交互地应用于一个或多个数据集。DNASTAR的GenVision Pro应用程序用于Sashimi图的分析(图3)。我们目前正致力于将GenVision Pro开发成一个功能齐全的基因组浏览器和多样本基因组分析器。
图3:GenVision Pro基因组浏览器显示特征注释和Sashimi图。