南湖新闻网讯(通讯员 竹永丽 陈华夏 )12月25日,第一届基因组育种算法国际竞赛颁奖典礼暨前沿论坛在我校作物遗传改良全国重点实验室六楼会议室举行。
据悉,本次基因组育种算法国际竞赛于2023年7月由华中农业大学联合崖州湾国家实验室、上海人工智能实验室、湖北洪山实验室、华为技术有限公司等发起,大赛主题是“如何利用海量基因组数据预测复杂性状”,旨在为参赛者提供展示基因组育种领域研究成果的机会,激发创新潜能,推动技术发展。大赛共吸引了全球38支队伍参与角逐,经过两轮经评审后,最终6支队伍进入决赛答辩。
决赛现场,我校作物遗传改良全国重点实验室主任、生命科学技术学院院长熊立仲、国际合作与交流部部长曾红霞、生命科学技术学院党委书记范金凤参加了活动,中国农业科学院作物科学研究所研究员徐云碧、中国农业科学院生物技术研究所所长谷晓峰、其他兄弟院校以及我校专家教授作为本次大赛的评委老师,活动由李兴旺教授主持。
活动现场
熊立仲在致辞中对各位老师同学的到来表示热烈欢迎,他表示,基因组育种算法竞赛不仅是一场技术的竞赛,更是一场智慧的碰撞。他希望各参赛团队充分发挥优势、加强合作与交流,用创意和智慧推动基因组育种研究和应用的进步。动科动医学院刘小磊教授宣读了评选规则,评委老师从算法的创新性、计算的复杂度以及预测的准确性等方面进行打分。
AIGES团队答辩现场
来自华中农业大学的AIGS团队主要使用深度学习的方法进行预测。使用MLP多层感知机对SNP的加性和显性效应提取特征,而对于LIT获得的互作SNP则用Transformer Encoder模块提取特征。最终利用MLP作为回归器训练模型,通过10折叉验证后,将训练好的模型进行预测,预测准确度接近组委会提供的参考结果。
来自杭州市农业科学研究院的参赛队伍HAAH从目前基因组育种存在的成本较高、难以应用的现状出发,提出通过只测序少量个体(如亲本)实现较高准确预测的方法。他们开发了算法模型FamBLUP,通过在BLUP计算中引入家系分组,利用家系内表型均值代替家系表型值,进行GBLUP,获得家系育种值;每个分组内的个体进行BLUP,获得个体育种值;家系育种值和个体育种值相加获得最终育种值。该方法在保证一定准确性的前提下,实现了降低测序成本的目的,最终斩获大赛三等奖。
中国农业科学院Dream World团队设计的算法在数据处理、模型参数选择上进行了创新。利用机器学习在非线性模式识别和特征选择上的强大能力,通过贝叶斯优化提高了参数搜索的效率。数据处理更加鲁棒,模型评估更加准确和全面,自动化的超参数选择提升了模型的预测性能。
来自华中农业大学的DeepBio_Star团队提出的算法MDG_MLP分为划分数据集、构建模型、筛选SNP位点、训练最优模型、预测群体表型五个部分,该方法利用多维空间特征融合提取SNP的特征、使用独特的算法增加降维的可解释性以及利用空间门控机制捕捉全局特征,实现了在预测玉米性状上最佳的准确性。
华中农业大学CHAOS团队主要从特征选择的必要性以及模型选择的思路两个方面进行阐述。在特征选择方面,团队从算法角度入手,通过过滤不相关的特征、减少SNP的数量减少计算量;从生信角度,过滤低质量SNP、保留显著SNP提高算法的速度和准确性。在模型选择上,团队主要考虑机器学习的多种算法及深度学习ANN,对其进行比较。
最后登场的是中国科学院遗传与发育生物学研究所Good Shooting团队,队长黄江伟展示了整体设计过程:首先通过计算猪和玉米性状的遗传力作为预测精度的追赶对象。创新性体现在使用特征选择模型、自主设计深度学习模型模块提高提取能力,使用集成学习输出结果,让算法更具泛化性。该团队也是唯一一个在猪性状上的预测结果高于现存3大常用模型预测精度的参赛队伍。同时,他们还对特征选择对于预测精度的重要性进行探索,发现良好的特征选择对提高模型增益非常有效。这一结论也引起在场评委老师的兴趣。
生命科学技术学院院长熊立仲教授和党委书记范金凤为一等奖获得者颁奖
评委为二等奖获得者颁奖
评委为三等奖获得者颁奖2
评委为优胜奖获得者颁奖
(以上图片均由 通讯员 侯国涛 摄)
最终,中国科学院遗传与发育生物学研究所Good Shooting团队获得一等奖,华中农业大学DeepBio_Star团队获得二等奖,华中农业大学CHAOS团队获得三等奖,杭州市农业科学研究院HAAH团队、华中农业大学AIGES团队、中国农业科学院Dream World团队获得优胜奖。大赛组委会为获奖同学颁发证书和奖品,并勉励同学们继续努力,明年以更优异的作品继续参赛。
活动现场,组委会特邀6名专家做主题报告,介绍基因组育种算法的研究进展和应用前景。徐云碧教授以“基因组选择:从狭义到广义”为题进行专题报告,回顾了近30年基因预测的发展历程,他指出,当前基因预测发展已经从简单的表型-基因型-环境的金三角结构,跨越到多维度、跨时空、相互关联的三维关系。未来的基因选择和智能育种必将通过算法将优良的基因型与基因、最优基因的调控网络以及特定的基因区域整合到所需的产品中去。
中国农业科学院生物技术研究所谷晓峰研究员则从表观遗传学层面出发,展示了通过数据驱动的多维表观图谱和基因的研究,对表观遗传智能预测和设计,从而合成和创制新种质的路径。
“基因组育种的发展离不开模型算法和各种基础分析工具的开发。育种的过程就是一个百里挑一的过程,基因组选择和预测则是一种科学的‘算命’。”刘小磊教授大家详细解说了团队研究KAML算法的来龙去脉,他指出,该方法可以获得稳定、准确、高效的预测准确性。
中国农业大学闫军副教授重点介绍了其所在团队开发的一站式全长转录本分析工具iFLAS,经检验,该工具具有操作简单、适用范围广的特点。
扬州大学徐辰武教授则从“提高基因组选择育种精度的统计策略和应用研究”的角度,详细为大家阐述了基因组选择的影响因素、常用建模方法的比较、多变量、多组学、跨群体基因组选择方法的应用。
西北农林科技大学生命科学学院院长马闯教授从对人工智能的组学数据深度挖掘,到多物种多组学的整合与发现,再到人工智能育种预测模型的构建,一步步加深了在场人员对基因组育种的认识。
审核人:肖英杰 李兴旺