Nature Methods

时间:2024-06-12

长读长RNA测序技术(long-read RNA-seq technologies, lrRNA-seq)的兴起引发了对其全面评估的需求。为了评估长读长方法在转录组分析中的有效性,长读长RNA测序基因组注释评估项目(Long-read RNA-Seq Genome Annotation Assessment Project,LRGASP)应运而生。

该项目通过使用不同的测序协议和平台,生成了超过4.27亿条来自人类、小鼠和海牛物种的长读长序列数据。这些数据集包括从互补DNA(cDNA)和直接RNA数据集中提取的长读长序列,旨在解决转录本异构体(transcript isoform)检测、定量和新转录本检测中的挑战。(6月7日Nature Methods Systematic assessment of long-read RNA-seq methods for transcript identification and quantification )

该研究表明,包含更长、更准确序列的文库能比那些仅增加读长深度的文库生成更准确的转录本,而增加读长深度则有助于提高定量准确性。在注释良好的基因组中,以参考序列为基础的工具展示了最佳性能。在使用无参考方法(reference-free approaches)或检测稀有和新型转录本时,建议结合额外的正交数据(orthogonal data)和重复样本。

LRGASP项目采用开放的社区合作模式,仿照之前成功的基准测试项目,测试了各种工具和平台在三个关键领域的表现:重建完整转录本、定量转录本丰度以及对缺乏高质量参考的基因组进行de novo转录本重建。长读长测序技术展示了其捕获完整和新型转录本的潜力,即使在熟知的基因组中也是如此。然而,不同工具之间的一致性较低,反映了分析目标的差异。有效地定量转录本依然具有挑战性,长读长工具由于通量和错误限制,仍然落后于短读长工具。

该合作研究为当前的实践提供了一个基准,并为未来转录组分析方法的发展指明了方向。通过对人类、小鼠和海牛物种的RNA样本进行生物学三重重复实验,并在一个地点提取RNA后,分配给所有参与组进行测序,确保了数据的可靠性。综合使用cDNA制备方法和直接RNA测序,结合多种平台的数据,LRGASP项目全面评估了各种实验方法和分析工具在不同挑战中的表现,提供了对当前实践的深入洞察和未来改进的建议。

该研究的重要性在于它不仅为研究人员提供了长读长RNA测序技术在转录组分析中的实际应用,还为开发更高效的转录本检测和定量方法提供了有价值的参考。这些努力将有助于提高转录组数据的精度和可靠性,从而推动基因组学研究的进步。

100医药网 www.100yiyao.net
版权所有 © 2019-2020 Design by Dongyan