智能育种技术是现代农业科技领域的一项重要创新,是现代农业发展的关键驱动力之一,该技术结合了人工智能、大数据、基因编辑和传统育种技术,旨在提高作物的产量、质量、抗病性和适应性,因其高效优质的特点,将成为未来育种领域的主流技术。目前,研究人员开发了不少智能工具,但是智能育种技术还处于萌芽期,随着科学技术的不断进步和公众意识的提高,智能育种技术有望在未来农业中发挥更大的作用。
智能育种作为现代农业生物技术的重要组成部分,正逐渐改变公众对作物遗传改良的传统认知。智能育种技术的发展可以追溯到20世纪初,随着基因编辑技术和人工智能的快速发展,智能育种已经成为提高作物产量、质量和抗逆性的关键手段,精准的编辑和强大的数据分析能力,极大地提高了育种效率。
智能育种技术的应用不仅可以提高作物的产量和质量,还有利于环境可持续性和高质量发展。通过培育抗病虫害的作物品种,可以减少农药的使用,保护生态环境。同时,通过培育适应极端气候条件的作物,可以提高农业系统的韧性,应对气候变化带来的挑战。
智能育种技术通过应用先进的计算模型和算法,深入分析作物基因组,以识别和利用决定作物性状的关键基因,这些性状包括但不限于生长速度、果实大小、抗病性、耐逆性等。与传统育种方法相比,智能育种技术可以显著缩短育种周期,提高育种效率。然而,智能育种技术也面临着一些挑战和伦理问题,比如公众对于基因编辑食品的接受度、对生态系统的潜在干扰、加剧种业市场不平等问题。
原始驯化育种
早期的人类虽然没有掌握遗传学理论知识,但已经开始有意识地对作物进行选择,这时期的育种技术被称为原始驯化育种,为现代品种培育积累了原始遗传资源基础。通过肉眼和经验对自然变异做出主观判断和选择,因此作物的改良进行速度极其缓慢。
杂交育种
杂交育种始于1865年,基于孟德尔遗传定律,通过人工控制不同遗传背景的亲本进行杂交、回交、自交等,以产生具有优良性状组合的后代。随着遗传学和生物统计学的快速发展,杂交育种技术得到了显著提升。育种者开始利用更多的遗传资源,通过遗传分析和选择策略,培育出具有特定性状的新品种。但杂交育种存在偶然性大,过度依赖少数亲本可能导致基因多样性的减少,限制育种潜力。杂交育种包括了杂种优势育种和诱变育种,这些育种技术在过去极大地推动了品种的选育和作物的产量,但是杂交育种存在连锁不平衡、复杂性状的选择难度大、育种周期长等一些局限性。
分子育种
分子育种贯穿20世纪末至今,基于对DNA分子水平上遗传变异的理解和基因工程的发展,通过分子标记辅助选择(MAS,Marker-Assisted Selection)和转基因技术来加速育种过程,快速识别和选择具有目标性状的作物,实现目标性状单个修饰与导入,分子标记可以提供更精确的遗传信息,减少因表型选择带来的误差。与此同时,基于全基因组关联分析(GWAS,Genome Wide Association Study),通过识别与复杂性状相关的遗传位点和潜在基因,推动了标记辅助选择在分子育种项目中的应用[2]。分子育种是现代农业生物技术的重要组成部分,通过科学的方法改良作物品种,提高农业生产效率和作物的适应性。分子育种存在“遗传力丢失”、上位性效应和环境与基因的互作效应考虑不足、多组学数据整合困难等问题。
智能育种
智能育种技术利用高通量测序技术(NGS,Next-generation Sequencing)快速获取作物的全基因组信息。通过生物信息学工具,研究人员能够识别基因组中的变异,这些变异与特定性状相关联。通过机器学习和深度学习算法,智能育种系统可以预测这些变异对作物性状的影响,从而筛选出具有理想性状的候选品种。智能育种技术还涉及到基因编辑技术,如CRISPR-Cas9是革命性的基因编辑工具,能够精确地添加、删除或替换作物基因组中的特定基因序列。通过智能育种,育种者可以创造出具有特定改良性状的新品种,例如抗旱性更强、营养价值更高或更适应特定气候条件的作物。此外,智能育种技术还结合了环境模型和作物生长模型,以模拟作物在不同环境条件下的生长情况,有助于育种者评估新品种在实际种植条件下的表现,并优化育种策略。总之,智能育种通过结合多种先进技术,实现高通量的数据分析和决策支持,从而加快育种进程,提升作物品种的创新能力。
基因编辑技术
基因编辑技术是一种革命性的生物技术,特别是CRISPR-Cas9基因编辑技术,允许育种人员以前所未有的精确度和灵活性编辑DNA。这项技术是基于细菌的免疫机制,利用CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats)序列和Cas9蛋白来实现对特定基因的敲除、插入或替换[4]。CRISPR-Cas9技术的操作流程主要包括设计sgRNA、构建编辑载体、细胞转染、筛选和验证以及功能分析等步骤。通过设计特定的单链RNA引导分子(sgRNA),育种人员可以将Cas9蛋白引导到目标DNA序列上,实现精确的切割。细胞在修复这种切割产生的DNA断裂时,可以引入突变,从而实现基因的编辑。随着技术的发展,CRISPR基因组编辑技术已经从基于DNA双链断裂的第一代技术,发展到不依赖于DNA双链断裂的第二代技术。然而,CRISPR-Cas9技术也存在一些挑战和局限性,比如脱靶效应、编辑效率和特异性的优化问题,以及在某些细胞类型和组织中的递送问题。尽管如此,基因编辑技术仍然被视为21世纪最为重要的生物发现之一。
机器学习技术
高通量测序技术的快速发展和测序成本的降低促使大量数据产生,对数据处理提出了更高的要求。机器学习技术能够整合生物学知识和组学大数据,为育种服务提供驱动力,并在基础研究与育种实践之间建立桥梁。机器学习是一门计算机科学,可以从数据中学习并做出预测或决策。机器学习技术主要有2种类型,即监督型和无监督型。监督学习的目的是获得一个模型,该模型将其预测因子(如DNA序列)映射到目标变量(如组蛋白标记)。目标变量可以是分类变量(分类变量)或连续变量(回归变量)。无监督学习是在没有任何标记结果的数据集上进行训练的,分类和特征提取就属于这一类。
自1940年以来,虚拟神经网络(ANN,Artificial Neural Network)是解决机器学习问题的众所周知的方法,受到动物神经系统的启发,人工神经网络由一个输入层、一个输出层和几个隐藏层组成。深度神经网络(DNN,Deep Neural Network)是ANN的一种,也是机器学习的一个相对新的分支。DNN与ANN的区别在于具有更多的隐藏层。显然,随着DNN预测能力的增加,数据需求也会增加。卷积神经网络(CNN,Convolutional Neural Networks)是DNN中的一种,CNN至少有1个卷积层,使其具备从连续信号,如序列上自动捕捉特征,已经有许多在植物上应用CNN的例子。递归神经网络(RNN,Recurrent Neural Networks)也是DNN中的一种,RNN用于处理输入序列[5]。机器学习在植物研究和育种中的应用正变得越来越广泛,可以帮助科学家从大量复杂的生物数据中提取有价值的信息,并用于指导植物育种实践,其最新应用包括数据降维、基因调控网络推断、基因发现和优先排序、植物表型组学分析和植物表型基因组预测。在大数据时代,机器学习能够对育种实践中收集的基因型、表型和环境数据之间的复杂关系进行建模,实现由数据驱动的高效精准的基因组设计育种。
高通量表型分析技术
高通量表型分析技术是现代农业生物技术领域中一个重要的研究方向,对于作物育种具有重要的应用价值。这项技术能够高效地获取和分析作物的表型信息,帮助研究人员发现有价值的表型特性并确定其遗传因素。传统田间表型信息获取方法主要依赖于人工采样测量,这种方法不仅费时费力,而且效率低、主观性强。
为了克服这些限制,发展了高通量表型信息获取及分析技术,这已成为植物表型研究的热点。表型研究主要集中于传感器、平台和信息分析3个方面。传感器用于捕获作物的物理和生物学特征,平台则包括地面、空中和空间基平台,用于搭载传感器和提供数据采集的场所,而信息分析方法则涉及对收集到的数据进行处理和解释,以提取有用的表型特征。在实际应用中,需要根据具体情况综合考虑实际需求和经济合理性来选择和设计表型信息获取技术。高通量表型信息的获取对于解决育种大规模数据处理的问题至关重要,通过大规模的基因型数据与表型数据之间的相关性挖掘,可以预测作物的品种表现。
合成生物学
合成生物学是一门新兴的交叉学科,融合了生物学、工程学、计算机科学和化学等领域的知识与技术。该学科的核心目标是通过设计和构建新的生物部件、设备和系统,或重新设计自然生物系统,以实现对生物过程的精确控制和优化。合成生物学的核心在于对生物系统的模块化设计,研究人员将生物系统分解为基本的功能性单元,如基因、蛋白质和代谢途径,然后通过合成DNA序列来构建这些单元。合成生物学的应用非常广泛,这一领域的发展不仅推动了基础科学的进步,也为解决全球性挑战提供了创新的解决方案。
中国科学院天津工业生物技术研究所在淀粉人工合成方面取得突破性进展,首次实现二氧化碳到淀粉的从头合成,这可能将改变淀粉生产的传统农业种植模式,转向工业车间生产模式。然而,合成生物学也引发了伦理和安全性的讨论,需要在发展中找到创新与责任之间的平衡。
中国农业科学院生物技术研究所构建了植物表观遗传修饰智能预测在线工具SMEP,该工具利用人工智能和深度学习技术,预测水稻、玉米等作物中的表观修饰位点,为作物功能基因组研究和智能设计育种提供工具和数据支撑。
华中农业大学的研究团队开发了一种名为“目标导向的优选技术”(TOP)的机器学习算法,该算法能够整合多个性状的组学数据,实现作物的协同选择。LightGBM集成模型在自交和杂交玉米系数据的基因组选择辅助育种中表现出其卓越能力,在预测精度、模型稳定性和计算效率方面都十分优秀。目前,LightGBM已作为工具箱CropGBM实现,包含多个新功能和分析模块,以促进作物的基因组设计育种。在转录水平上,中国农业大学汪海团队利用17个植物的基因组和转录组数据,开发出PhytoExpr深度学习模型,用于功能性顺式调节变异设计和顺式调节序列的从头设计,该模型还能对未知物种中的未知基因家族作出可靠预测。智能育种技术包括但不仅限于玉米和水稻,未来将有越来越多的作物加入这一智能化的育种领域。
近年来对植物调控网络和调控机制的不断深入研究,为智能育种奠定了发展的基础,与此同时,基于人工智能开发的遗传预测工具也极大地推动了植物科学的进一步研究。作物产量的提高很大程度是由品种决定的,因此培育出优良品种一直是一代又一代育种人的梦想。在高通量测序技术日趋成熟、大数据和人工智能席卷植物领域的时代,我国育种行业面临着巨大的挑战和机遇。未来已来,智能育种将整合基因组学、蛋白组学、转录组学、代谢组学、环境组学、微生物组学、表型组学,用机器学习构建理想模型,不管是是优化已有模型还是建立新模型,建立起高效的育种体系,以应对农业所面临的压力,提高我国种业在国际市场上的竞争力。
DOI:10.19904/j.cnki.cn14-1160/s.2024.21.017
声明:本文仅用于学术交流和学习,不得用于商业用途,侵删。转载请注明出处。