【期刊信息】

Message

刊名:植物学报
曾用名:植物学通报
主办:中国科学院植物研究所;中国植物学会
主管:中国科学院
ISSN:1674-3466
CN:11-5705/Q
语言:中文
周期:双月
影响因子:1.422857
被引频次:190718
数据库收录:
中文核心期刊(2017);SCI科学引文索引(2014);统计源期刊(2018);CSCD中国科学引文库(2019-2020);期刊分类:林业

现在的位置:主页 > 期刊导读 >

植物及烟草表型组学大数据研究进展

来源:植物学报 【在线投稿】 栏目:期刊导读 时间:2021-06-10

作者:网站采编

关键词:

【摘要】近年来,随着高通量植物表型数据获取技术的广泛应用和植物表型数据的快速积累,逐步形成了以植物表型组学数据为基础、以多学科交叉分析技术为手段的大数据体系,并在植物表型

近年来,随着高通量植物表型数据获取技术的广泛应用和植物表型数据的快速积累,逐步形成了以植物表型组学数据为基础、以多学科交叉分析技术为手段的大数据体系,并在植物表型大数据的数据获取、数据存储管理以及数据分析应用等方面取得了较快的研究进展,利用表型大数据开展植物育种尤其是为作物进行智能辅助育种已逐渐成为研究热点。为及时了解植物表型大数据相关技术的发展,跟踪植物表型大数据的研究前沿与热点,回顾了植物表型组学的相关概念,并对植物表型组学大数据的研究进展,尤其是对其在育种方面的应用进行了梳理,同时关注了烟草表型大数据的产生和发展过程,并对该领域今后的发展作了展望。

1 植物表型组学大数据发展概况

在植物学和遗传学研究领域,特别是在作物育种领域,表型(Phenotype)是一个使用非常广泛的术语,该术语来源于希腊词语Phainein 和Typos的组合。在1911 年“表型”这一术语被Johannsen首次定义为“可通过直接观察或精细测量进行描述区分的生物属性”[1]。表型组(Phenome)则在1949 年被Davis 首次定义为“细胞中所有非遗传性、非自复制部分的总和,是所有表型的集合”[2]。20 世纪90 年代,人类基因组、转录组以及遗传疾病关联分析等各类研究的开展促进了相关理论的不断发展,1997 年,Schork 等[3]首次在疾病研究中提出了表型组学概念。此后,随着表型组学研究的不断深入和发展,表型组学的定义也在不断地完善。2010 年,Houle 等[4]定义表型组学为“在整个组织范围内获取多维表型数据”。2013年,Fiorani 等[5]提出将植物表型组学定义为“作为一套方法学,在不同尺度上精确测量植物的生长、结构和组成”。现在植物表型组学更倾向于被定义为“在植物发育过程中,对整个生物体进行高通量数据准确采集和多维表型分析的多学科研究”[6]。表型组学自20 世纪90 年代被提出,经历多年的研究和发展,现已逐渐成为生命科学领域的一个重要分支。

系统的植物表型组学研究正式开始于20 世纪末,主要收集质量较高、可重复获取的植物表型数据,在该数据的基础上分析基因型和环境因素的互作效应,研究该数据对产量、质量和抗性等主要植物性状的影响[7]。进入21 世纪以后,随着下一代测序技术的广泛应用和基因组学研究的不断深入,表型组学的理论基础和研究方法也得到了快速的发展[8]。2011 年,澳大利亚植物学家Furbank等[9]指出,高通量表型数据采集技术在田间的应用、全球表型组学信息数据库的元数据标准化缺失、植物非生物胁迫的高通量表型数据分析等问题已经成为植物表型组学研究的瓶颈。为有效解决这些问题,打破植物表型研究的发展瓶颈,大量优秀的商业机构和科研机构进行了相关技术的开发,促进了高通量、高精度表型数据采集工具的快速发展。随着表型获取技术精度的不断提升、通量的不断提高、成本的逐渐降低,越来越多的植物进行了高精度高通量的表型数据获取,如拟南芥[10]、大麦[11]、玉米[12]等。

科学大数据的形成依赖于海量数据的获取和积累,随着各类高通量表型数据采集设备的使用,植物表型数据量也呈现出快速增长的态势。随着数据体量不断增大,各类植物表型数据库和相关数据管理分析平台纷纷建立,期间多种学科领域数据分析和挖掘技术也开始研发与应用,逐渐形成了数据体量大、增长速度快、多学科技术交叉、数据多样的植物表型组学大数据体系,该体系涵盖了从植物细胞到植物群体的多个尺度、多种生长环境下植物性状的遗传与变异,以及植物对生物和非生物胁迫的响应等各类信息[13]。

2 植物表型组学大数据研究进展

植物表型组学大数据的研究主要集中在大数据的获取、存储管理、分析和应用4 个方面。其中数据获取主要是利用各类成像技术、设备平台获取表型数据;数据存储管理是将数以Tb 计的表型数据进行存储、管理,以便进行后续的数据检索、分析和应用;数据分析是通过各种技术手段分析表型数据,以获得可用的生物学、农学知识;数据应用主要集中在育种方面,包括鉴定各类候选基因和分子标记,将表型组数据与其他组学数据整合,建立各类育种辅助模型等。

2.1 植物表型数据的获取

植物表型数据的获取是指利用包括多光谱成像、高光谱成像、红外成像、光合荧光成像、CT 扫描和MRI 扫描等技术在内的数据采集设备,从细胞、器官、植株、群体等不同尺度对表型数据进行获取的过程。数据采集设备所搭载的平台涵盖了从室内到大田,从便携式表型采集设备到各类型航空飞行器等多个层面。利用这些方法进行数据采集的植物主要包括:拟南芥[10]、大麦[11]、玉米[12]、小麦[14]、大豆[15]、水稻[16]等。表1 列举了高通量植物表型数据获取的平台、支持的采集技术、应用场景以及优缺点等信息。


文章来源:《植物学报》 网址: http://www.zwxbzz.cn/qikandaodu/2021/0610/1287.html


上一篇:新型植物垂直绿化研究
下一篇:重金属积累影响植物和植食性昆虫互作的研究进