自然界中,微生物组(亦称“菌群”)无所不在,其结构深刻体现着生态系统的健康状态,因此微生物组结构比对是菌群检测服务于精准健康、精准护理与精准营养的核心环节之一。中国科学院青岛生物能源与过程研究所单细胞中心提出了Dynamic Meta-Storms(DMS)算法,能够更精确地计算菌群相似度。该研究在线发表于Bioinformatics。
鸟枪法元基因组(shotgun metagenomics)通过直接测定菌群总体DNA序列,来刻画一个菌群的结构和功能。然而如何精确地计算鸟枪法元基因组数据点之间的量化差异,一直是业界的热点问题。副研究员苏晓泉带领的单细胞中心生物信息研究组,针对上述关键技术瓶颈开发了Dynamic Meta-Storms(DMS)算法。DMS充分利用菌群中已知物种的生物分类和进化关系,对未知物种的进化位置进行理性推测(图1),从而能够全面、精确地计算元基因组之间物种水平的相似度(图2a)。
图1 Dynamic Meta-Storms能全面、精确地计算元基因组之间物种水平的相似度。
与此同时,得益于高性能并行计算优化技术,在计算百万数量级之元基因组样本的相似度时(5×1011次相似度计算),DMS在单个计算节点上仅用6.4小时即可完成,与目前最快算法相比,速度提高了20%,同时还节省了40%的内存使用率(图2b)。
图2 与其他算法相比,Dynamic Meta-Storms能够更精确地计算菌群之间相似度(a),同时在计算速度和计算资源利用率上有显著提升(b)。
作为元基因组学领域的共性基础算法之一,DMS将基于单细胞中心开发的微生物组搜索引擎(http://mse.ac.cn),直接服务于地球微生物组计划(EMP)、人体微生物组计划(HMP)、中科院微生物组计划等大科学计划,从而支撑基于菌群测序的精准健康、精准护理与精准营养。
该论文的并列第一作者是生物信息研究组荆功超和张玉凤,由苏晓泉主持完成,并获得国家自然科学基金、山东省自然科学重大基础研究项目、中科院微生物组计划等的支持。