测序技术和生物信息学工具的进步极大地提高了微生物基因组数据中的回收率。评估基因组的质量是下游分析之前的关键步骤。在这里,昆士兰科技大学Gene W. Tyson提出了CheckM2,这是一种使用机器学习预测基因组质量的改进方法。
本文要点:
1) 通过使用合成和实验数据,作者证明CheckM2在准确性和计算速度方面都优于现有工具。此外,CheckM2的数据库可以用新的高质量参考基因组快速更新,包括仅由单个基因组代表的分类群。
2) 作者还表明,CheckM2准确预测了来自新谱系的基因组质量。CheckM2在细菌和古菌谱系中提供了准确的基因组质量预测,并且在推断生物学结论时提高了可信度。
Alex Chklovski et.al CheckM2: a rapid, scalable and accurate tool for assessing microbial genome quality using machine learning Nature Methods 2023
DOI: 10.1038/s41592-023-01940-w
https://doi.org/10.1038/s41592-023-01940-w