生物所构建植物表观遗传修饰智能预测在线工具SMEP

近日,中国农业科学院生物技术研究所谷晓峰课题组、田健课题组和普莉课题组在《新植物学家(New Phytologist)》上发表了题为“A deep learning approach to automate whole-genome prediction of diverse epigenomic modifications in plants”的研究论文,构建了植物表观遗传修饰智能预测在线工具SMEP(http://www.elabcaas.cn/smep/index.html)。该项工作通过利用人工智能(Artificial Intelligence,AI)的方法,深度学习植物DNA甲基化、RNA甲基化、组蛋白修饰等序列信息,系统实现了水稻、玉米等物种中表观修饰位点的预测,为作物功能基因组研究和智能设计育种提供工具和数据支撑。

表观遗传修饰包括DNA/RNA甲基化和组蛋白修饰,是调控真核生物基因转录、RNA代谢以及其他生物过程的主要驱动因素。近年来,检测技术和高通量测序的发展推动了作物表观组学的研究。然而,由于受到检测技术、实验成本、取材组织以及表观修饰动态可逆的调控特性,仍有大量表观修饰位点没有得到发掘和研究。因此,如何利用现有表观组学数据深入探索潜在的表观修饰位点是当前表观遗传研究面临的关键问题。

目前,人工智能技术在表观组学大数据分析和预测上展现广阔的应用潜力。该研究基于卷积神经网络(CNN)方法,利用课题组前期绘制粳稻日本晴的多种表观修饰图谱,构建得到了具有高准确度的智能预测模型(SMEP)。该模型经过参数优化、交叉验证以及实验验证,SMEP在预测DNA甲基化、RNA甲基化和组蛋白修饰等表观遗传修饰位点中具有高可信度。同时,该研究还成功地将SMEP模型应用于籼稻代表品种93-11及玉米品系B73中表观修饰位点的预测。由于SMEP预测了大量正常实验条件下检测不到的位点,团队进一步通过热激胁迫处理实验,验证了SMEP预测的特异地响应热激反应的6mA修饰位点,表明SMEP预测的表观修饰位点可能参与多种环境响应。最后,在线构建了SMEP智能预测工具,提供了检索表观遗传修饰位点和基因表达数据的可视化界面供用户参考使用,为水稻、玉米等物种的重要农艺性状智能设计提供挖掘工具和数据支撑。

生物所谷晓峰、田健、普莉为论文通讯作者,研究生王一凡、张平贤、郭位军、刘汗青为共同第一作者,该研究得到国家转基因重大专项、国家自然科学基金、中国农科院科技创新工程等项目资助。

 

图注 基于深度学习任务模型的 SMEP 计算工作流程

原文链接:https://nph.onlinelibrary.wiley.com/doi/abs/10.1111/nph.17630