作物表型组大数据技术及装备标准体系构建研究

温维亮 ,  顾生浩 ,  张颖 ,  杨万能 ,  郭新宇

工程(英文) ›› 2024, Vol. 42 ›› Issue (11) : 184 -193.

PDF (2461KB)
工程(英文) ›› 2024, Vol. 42 ›› Issue (11) : 184 -193. DOI: 10.1016/j.eng.2024.06.001
研究论文

作物表型组大数据技术及装备标准体系构建研究

作者信息 +

Standard Framework Construction of Technology and Equipment for Big Data in Crop Phenomics

Author information +
文章历史 +
PDF (2519K)

摘要

在作物功能基因组学、数字育种与智慧栽培等的需求牵引下,作物表型组学近年来发展迅速。然而,作物表型组学技术及装备产品的研发与应用缺乏标准规范已成为限制作物表型产业高质量发展的瓶颈问题。本文从作物表型产业出发,绘制了作物表型组大数据技术及装备产业图谱,并分析了作物表型标准体系构建的必要性和现状,探讨了作物表型组大数据技术及装备标准体系的构建目标,提出了标准体系的组织结构,从作物表型硬件装备研发、作物表型数据采集和作物表型数据存储管理三方面探讨了标准制定的技术要点。最后围绕如何推进标准体系构建和标准的评价等进行了讨论和展望,以期为作物表型标准体系的构建提供思路。

Abstract

Crop phenomics has rapidly progressed in recent years due to the growing need for crop functional genomics, digital breeding, and smart cultivation. Despite this advancement, the lack of standards for the creation and usage of crop phenomics technology and equipment has become a bottleneck, limiting the industry’s high-quality development. This paper begins with an overview of the crop phenotyping industry and presents an industrial mapping of technology and equipment for big data in crop phenomics. It analyzes the necessity and current state of constructing a standard framework for crop phenotyping. Furthermore, this paper proposes the intended organizational structure and goals of the standard framework. It details the essentials of the standard framework in the research and development of hardware and equipment, data acquisition, and the storage and management of crop phenotyping data. Finally, it discusses promoting the construction and evaluation of the standard framework, aiming to provide ideas for developing a high-quality standard framework for crop phenotyping.

关键词

作物表型组学 / 大数据 / 表型技术及装备 / 标准规范 / 产业图谱

Key words

Crop phenomics / Big data / Phenotyping technology and equipment / Standard framework / Industrial mapping

引用本文

引用格式 ▾
温维亮,顾生浩,张颖,杨万能,郭新宇. 作物表型组大数据技术及装备标准体系构建研究[J]. 工程(英文), 2024, 42(11): 184-193 DOI:10.1016/j.eng.2024.06.001

登录浏览全文

4963

注册一个新账户 忘记密码

1 引言

人类社会的发展正在经历信息革命和智能革命,大数据研究正在成为继实验科学、理论分析和计算机模拟之后新的科学研究范式。作物科学研究也正在从理论科学、实验科学和计算科学步入以数据密集型知识发现为研究范式的学科发展阶段,直接推动作物科学进入以大数据为核心的组学研究时代[1]。20世纪80年代以来,随着基因组学和高通量测序技术的发展,生命科学进入到大样本、大数据、大科学、大发现的“组学”(-omics)研究新时代。

在获得海量作物基因组信息的基础上,高分辨率、高效地解析基因功能、环境响应及作物表型三者的相互作用机理已成为一个全新的挑战[2]。在此背景下,作物表型组学[34]近年来快速发展,并已成为国际作物科学研究的热点领域[510]。通过组织生命科学、信息科学和工程科学等多学科交叉合作研究,突破全生育期、复杂生长条件下作物表型高通量、自动、精准感知与获取,解决多模态、多尺度、多生境的组学大数据智能解析,已成为当前国际农业科学和生命科学领域重要的战略前沿方向。

作物表型是指能够反映作物细胞、组织、器官、植株和群体结构及功能特征的物理、生理和生化性状,其本质实际是作物基因图谱的时序三维表达及其地域分异特征和代际演进规律[11]。作物表型是基因-环境互作后其遗传信息在时空中被选择性地表征,涵盖多尺度、多模态、多生境下的遗传、变异及环境响应等信息。作物表型性状的复杂程度决定了表型组大数据的产生和形成是一项巨大的科学系统工程(图1)。它以作物育种和栽培的实际需求为导向,通过农学、自动化、机械工程、图形图像、遥感、生物信息学等多学科交叉,以新型物理、化学和生物传感器为依托,结合以人工智能及物联网技术为代表的新一代表型获取技术及平台设备,实现作物表型信息的全生育周期、多尺度、多维度、自动化获取,进一步整合作物大数据算法、数据挖掘、分析管理技术,形成可为智能设计育种和智慧栽培提供系统化、全方位、全流程的组学大数据。

当前,与信息技术、智能装备深度融合的作物表型组学已成为抢占未来农业产业发展制高点的关键。国内外作物表型组大数据技术及装备研发呈现由新兴学科向学科规模化建设,由单一尺度、关键时间点的表型解析向综合化、智能化及全生命周期的连续检测,由表型数据组内关联向多组学协同创新研究转型的发展趋势。单一和个体表型信息不能满足新时代“组学”关联分析的需求,而系统完整的表型信息将是未来研究的基础。

为了获取多年、多点的作物表型组大数据以满足作物育种和栽培研究及应用的需求,需要研发面向作物科学研究人员(简单易操作)、好用(稳定性好、精度效率高)、用的起(低成本)的作物表型组大数据技术及装备产品。作物表型组大数据技术及装备预期将成为作物科学转型升级的新一代信息化基础设施。

在“人工智能 + 大数据”新的科学范式下,为了实现作物科学的数字化转型升级,作物科学研究为作物表型组学提出了新的问题[12]:如何高通量获取作物表型大数据、如何得到高质量的作物表型大数据、什么样的作物表型数据可以满足大模型构建的需求。此外,传统作物科学中人和作物的关系也正在逐步向人-机-作物的互联、互通、互操作模式转变。为此,领域人员通过研发作物表型组大数据技术及装备解决这些问题。然而,随着研发和实践的深入,领域人员发现迫切需要构建作物表型组大数据技术及装备标准,规范作物表型组学和相关产业的高质量发展。

本文针对作物表型组学研究过程中缺乏全流程标准规范的问题,从产业需求出发,绘制作物表型组大数据技术及装备产业图谱,分析了标准体系构建的必要性、现状和目标,探讨作物表型组大数据技术及装备标准体系的组织结构和构建的技术要点,最后对作物表型组大数据技术及装备的发展进行展望。

2 作物表型组大数据技术及装备产业图谱

2.1 产业图谱绘制

为梳理作物表型组大数据技术及装备全流程,探讨绘制了作物表型组大数据技术及装备产业图谱(图2)。产业图谱有助于分析和展示作物表型产业链信息和关系,进而使标准体系的构建更契合作物表型产业发展的趋势。

作物表型产业链的主要参与者包括用户、研究机构、表型公司、政府部门和供应商。其中,作物表型大数据技术及装备的用户包括育种企业、品种区试站、科研院所和规模化农场等,用户向研究机构和表型公司提出需求,明确应用场景。研究机构得到政府部门、私营企业或非政府研究资助机构的研发资助,根据用户需求,通过集成其他领域成熟的元器件、技术和装置,开展关键技术与装备的研发;然后形成表型技术及装备原型,并不断迭代熟化成为表型产品,通过表型公司进行成果转化;表型公司进行产品的推广;研究机构和表型公司向用户提供技术支撑和服务,用户向研究机构和表型公司反馈表型产品使用过程中存在的问题并得到优化反馈。在此过程中,供应商向研究机构和表型公司提供传感器等原材料和生产加工服务。此外,政府机构根据研发过程中的反馈,确定和调整项目资助计划甚至立法,其对于农业政治问题、数据获取法规或人工智能领域等主题尤为重要。

具体地,图2列出了作物表型组大数据技术及装备产业链中的典型用户、国内外主要研究机构、作物表型的关键技术、市场上已流通的代表性产品、国内外专门从事作物表型的公司、作物表型产业可提供的主要服务以及作物表型技术、装备和产品的评价体系(产品服务的竞争力)等。需要说明的是,图中仅列出了我们熟知的表型相关研究机构、公司、平台和产品。

2.2 产业问题分析

作物表型组学研究以及作物表型组大数据技术及装备的研发与应用,都带动了作物表型相关产业的快速发展。然而,作物表型组大数据技术及装备的快速发展同时也面临着诸多问题,如:

(1)以高校和科研院所为主体的作物表型技术和装备研发虽然可以解决特定需求,但普适性差、重用度低、重复研发现象严重[13],难以形成好用的、用得起的表型产品[14]。

(2)作物表型传感器、成像单元、表型平台、解析软件等多个环节多不是一个单位完成,多个元器件和技术的上、下游集成工作量大、效率低,难以以高效的方式开展高稳定性表型产品的集成研发工作。

(3)国内外育种企业和科研机构获取了大量作物表型数据,但数据标准不一、各为己用,同时数据保护以及相关法规也存在阻碍,难以实现共享,数据价值有限。

(4)由于表型数据结构化水平低,表型数据处理需要大量人工交互,难以形成具有批量处理能力的管道化、自动化的表型解析算法和软件,限制了作物表型组大数据转化为作物育种和栽培专家可用的表型性状。

综上可知,这些问题的核心是目前缺乏作物表型组学相关的标准规范。因此,构建作物表型组大数据技术及装备标准体系,对于作物表型组学从研究走向应用尤为重要。

3 标准体系构建的必要性、现状和构建目标

3.1 标准体系构建必要性

作物表型组大数据技术及装备作为作物科学向数据科学转型升级的新一代信息化基础设施,将与作物科学进行全方位地结合,迫切需要构建系统化标准体系,引导规范作物表型组大数据相关产业的高质量发展。

从宏观上讲,作物表型组大数据技术及装备标准体系的构建有以下三大必要性:

(1)如上所述,目前作物表型技术和装备的产业图谱已逐渐清晰,并形成了一个新的产业,而产业发展、设备设施研发以及产业服务能力提升都需要相关标准规范的引导。

(2)当前,作物多组学研究[15]、智慧农业研究与应用[16]以及农业领域AI for Science新的科学范式等,都迫切需要高质量的作物表型组大数据,而高质量的表型组大数据需要标准规范的约束才能得到。

(3)开展数字育种[17]并加速育种[18]进程过程中,需要围绕作物表型大数据进行描述、表示、管理、应用和服务,并在后续行业发展过程中形成一种社会化服务模式,这些都需要作物表型标准规范加以约束和指导。

3.2 作物表型组大数据相关标准规范工作现状

基因组、转录组和代谢组等经过长时间的发展,已形成如ENCODE和Expression Atlas等标准规范。与之相比,作物表型组学起步较晚,作物表型组学领域研究人员近年来积极呼吁构建相关标准规范,以促进行业的快速发展。然而,目前相关标准规范主要集中于数据的存储和管理方面。

研究人员将科学数据通用范式FAIR(Findable, Accessible, Interoperable, Reusable)[19]拓展应用于植物表型[20],并以具体案例探讨了在植物表型领域应用的优势和挑战。MIAPPE (Minimum Information About a Plant Phenotyping Experiment)[13]是植物表型领域较为熟知的规范,主要关注表型数据的整理、利用和共享等,近年来该领域学者又对其进行拓展[2122]。研究人员还探讨了表型数据的共享及存储存在的问题。虽然已公开的表型数据具有一定的可重用性,但公开数据的数量有限[23],且存在数据对植物物种的覆盖范围有限以及配套数据的完整性低等问题,使得已公开的数据难以通过深度学习算法进一步优化或整合数据以提高其可用性。

然而,各国国情、农业信息化和智能装备技术水平不一,某些表型表现出对地理环境或其他特定因素的高度易感性,发达国家的表型相关标准难以直接复制,需要根据各国的实际情况构建相关标准规范。此外,这些标准规范主要聚焦在数据层面,尚无法覆盖到作物表型的全产业链,主要面向特定科研机构和高通量表型平台所制定,未在科研和产业中广泛应用。实际上,作物表型组学大数据从实验场景的设计、表型获取的设备、数据采集的手段、数据处理的方法到数据应用的对象是一个环环相扣的过程,作物表型组学标准规范不能只关注一个或几个环节,其应该是一个面向作物表型全流程的标准体系。因此,迫切需要开展作物表型组大数据技术及装备标准体系构建相关研究。

3.3 标准体系构建目标

作物生命过程和农业生产场景极为复杂,作物形态结构复杂、交叉遮挡严重,田间生产以高密度群体为主,作物多维表型性状受光照、温度、湿度、气流等诸多因素影响较大,非结构化因素过多,这也是农业生产难以实现无人化、工业化的本质。

作物表型组大数据技术及装备标准体系的总体目标是通过标准规范的约束,提高作物表型全流程的连贯性和一致性,获取结构化程度高、质量可靠、完整性好的作物表型组大数据,使得硬件设备设施、表型解析算法、数据的应用、管理和共享能够互联互通,支撑作物表型产业的高质量发展。这些目标难以同步实现,因此是标准体系构建的长期目标。

在产业有需求、产品有形态、用户对象明确、应用场景清晰的基础上,通过构建作物表型组大数据技术及装备系列标准规范,实现以下4个具体短期目标(图3):

(1)明确作物表型传感器、平台等装备的研发接口,提高硬件装备的一致性和可重用性,进而提升平台稳定性、降低生产成本。

(2)通过限定表型产品的具体应用场景,提高表型产品的工作效率、降低运维成本。

(3)通过规范表型数据采集流程,降低数据噪声及获取和使用成本,提升表型数据的结构化和一致性水平,提高表型数据可用性,为实现表型数据处理、分析、应用和共享提供可能。

(4)通过提升表型数据的结构化程度,为表型解析算法提供高质量、高一致性的输入数据,进而推进表型数据处理和解析的管道化和自动化水平。

4 作物表型组大数据技术及装备标准体系构建路线

本节基于我们的实践和思考,提出标准体系组织结构,并探讨标准体系构建的要点。

4.1 标准体系组织结构

作物种类繁多,品种丰富,生长环境各异,不同生育期形态、结构等表型差异显著,难以形成一套通用的标准。因此,本文围绕作物表型产业需求和特色,尽可能抽提共性程度高的内容以形成标准框架,对于个性化程度高、难以形成标准化的内容暂不重点考虑。

图 4给出了作物表型组大数据技术及装备标准体系组织结构图,主要包括作物表型硬件装备研发标准、作物表型数据采集标准和作物表型数据存储管理规范三大部分。在作物表型产业全流程中,表型获取硬件装备和数据采集方法等前阶段的流程对于后续数据处理、解析和应用等具有重要影响,具有更高的优先级,故占据了整个标准体系框架中的大部分内容。由于作物表型解析算法除了依赖标准化的数据外,更多的是与具体应用需求所需的表型性状相关,个性化程度高,难以形成共性的标准规范,故未将其列入标准体系中。

在作物表型硬件装备研发标准方面,主要包括传感器、成像单元和表型平台研发标准三部分。因大田环境的光照、风速、降雨等诸多因素对作物表型获取具有直接影响,设施和室内环境相对可控,故作物表型数据采集标准按大田和设施/室内分为两部分。作物表型数据存储管理规范重点关注原始数据和解析数据的格式以及数据配套信息的完整性问题,故未做细分。

作物表型组大数据技术及装备标准是一个整体的体系,各标准规范之间有相互衔接依存的关系,一般不能独立存在。例如,大田轨道式平台及挂载的成像单元对于大田轨道式表型平台数据获取规范有直接影响,后续的作物表型存储和管理规范也需要考虑所获取数据的格式等问题。需要说明的是,在标准制定过程中,组织结构图中各子节点仍需要对细节进行规范,细分成多个标准规范,如面向数字育种、智慧栽培等不同应用场景的标准规范细分。

4.2 标准体系构建要点

团队近年来围绕多生境作物表型平台研发[2429]、作物表型大数据获取[3033]、多尺度作物表型解析[3437]等方面开展了大量工作,积累了丰富的经验。在此基础上,对于作物表型组大数据技术及装备标准体系构建给出了一些详细的建议。

4.2.1 作物表型硬件装备研发标准构建要点

作物表型硬件装备研发标准的对象主要是面向作物表型产业图谱中的供应商、研究机构和公司等从事产品研发和服务的群体,可规范并指导作物表型元器件、设备设施和技术系统的研发。

(1)传感器研发/集成标准。作物表型传感器目前以集成成熟的传感器为主,但这些传感器大部分不是面向作物表型研发。例如,激光雷达主要面向自动驾驶和目标检测等远程任务研发,在近距离的地面表型平台场景下的点云分辨率较低;RGB相机主要面向工业成像或消费级任务研发,在田间场景表型任务中的焦距和稳定性有待提升等。

然而,在作物表型领域,传感器一旦更新换代或需要更换选型,将涉及到表型平台对接传感器的尺寸、承重、通讯、控制等一系列问题,同时不同传感器输出数据格式、分辨率等不同,对后续表型解析算法也会产生重要的影响。因此,作物表型传感器的研发或集成是作物表型标准体系中的重要内容。

作物表型传感器主要包括可见光、多光谱、高光谱、热成像、激光雷达、离子和小分子传感器等。传感器的研发或集成标准应重点关注传感器的尺寸、重量、有效距离、通信接口协议、控制方式、数据分辨率、数据获取间隔、数据输出格式等。

(2)成像单元研发标准。上述传感器被认为是单一数据源(单源)的,作物表型任务多需同步获取多源数据,整合多个单源传感器研发成像单元可实现多源数据的同步采集。成像单元可在硬件端实现多源数据的融合,如PlantEye;也可以是直接将研发好的多个单源传感器通过物理整合构成,并在数据端进行融合解析,如PhenoWatch。

作物表型成像单元主要是挂载在传动装置上形成表型平台,因具体需求不同关注的指标不同。例如,挂载在无人机、机器人、车载式等平台上的成像单元要求体积小、重量轻、功耗低,而挂载在轨道式表型平台或流水线式表型平台的成像单元要求对尺寸、重量和功耗的限制较小,更关注数据分辨率和稳定性等。因此,作物表型成像单元标准应重点关注尺寸、重量、功耗、接口协议、控制方式、数据分辨率、数据输出格式等指标。

(3)作物表型平台研发标准。作物表型平台类似于农业领域的农机具,有多种样式,且需考虑信息-农艺-农机的结合,因此也需要系列的标准规范表型平台产品的研发。作物表型平台因应用场景和目标、构建及运维成本等差异主要包括无人机式、轨道式、自走车式、机器人式、流水线式和便携式等。由于田间和设施环境的地面和土壤情况、光照和风速等环境情况直接决定了表型平台的成像和行走方式以及构建和运维的差异,各平台又具体分为大田和设施环境两种。

具体到各表型平台研发和构建的标准规范,轨道式表型平台应关注地面硬化水平,避免时间长产生平台塌陷或轨道变形。此外,还需要考虑平台构建的高度范围、x-y轴的运动范围、成像单元的运行速度等指标。具有远程控制、路径设计等功能,以及所获取数据要求有时间和位置坐标等都是标准重点关注的,且大田和设施环境两种轨道式平台的指标数值可能有差异。大田轨道式表型平台要求避免在风口搭建;流水线式表型平台标准应重点关注流水线植株承重、植株最大尺寸、流水线距离地面高度范围等指标;车载式和机器人式表型平台应重点关注可搭载传感器或成像单元的最大尺寸、承重和功耗以及续航时间等,且需有稳定采集指标,保证因地面不平稳产生颠簸导致的数据质量问题。车载式表型平台还应关注车身跨度、平台高度、转向方式等;机器人表型平台的研发应适应典型大田或设施环境生产场景,需限定车身最大宽度,以便其可在作物行间行走,同时平台需具有路径规划、自主导航和避障等功能。

4.2.2 作物表型数据采集标准构建要点

与作物表型硬件装备研发主要面向产业链前端的群体不同,作物表型数据采集标准规范主要面向产业链后端,即表型产品的用户,因此具有更多的受众和更强的约束力,也是保证好的表型产品能够最大程度发挥其价值的关键。作物表型数据采集标准通过规范和指导用户获取高质量的数据,可以为后续表型解析和应用提供结构化水平高、完整性好的输入,进而提升表型数据解析和应用的自动化水平。

(1)大田环境表型数据采集标准规范。与设施和室内环境相比,大田环境较为复杂,尤为需要制定数据获取标准规范提高数据的一致性。数据获取首先需要对采集的时间和天气条件进行限定,如数据获取时的最大风速限定、不能在多云天气导致太阳辐射剧烈变化的条件下获取相关光谱数据等;每次数据采集需要做相关标定,如RGB图像对应的颜色标定、光谱影像的标准色谱标定等。

不同表型平台重点关注的数据获取标准要点包括:大田无人机表型平台建议针对特定需求统一飞行高度,确定相邻航线的重叠度、航片最大倾角等;大田轨道式表型平台建议统一传感器或成像单元距离地面的高度,确定相邻路径的重叠度和数据获取时间;大田自走车式和机器人式表型平台建议明确平台进入种植区域的地面情况等避免车体陷入或破坏作物。同时,从移动式表型平台获取的所有数据还需有配套的时间和位置信息,用于后续解析到表型信息后与小区或植株等对应。此外,大田环境的光照、温湿度等环境数据变化较快,应配套作物表型-环境数据同步采集标准,提高数据的可用性。

(2)设施/室内环境表型数据采集标准规范。设施和室内环境较为稳定,在确保农业科研和生产目标的前提下,应使得作物的播栽方式尽量适合于表型平台获取数据。设施环境下需要保证环境的整洁。例如,流水线表型平台的传送带上和成像室中不能有作物叶片残留,以减少人为噪声的影响。室内作物显微表型[30]数据获取涉及样本的制备,需要对取样部位、样品含水量等做出限定,以保证数据的一致性。

此外,无论是大田还是设施及室内环境下,各数据获取标准规范均需包含试验前平台和传感器状态评测、数据获取的记录、数据检验等,以确保数据完整性。

4.2.3 作物表型数据存储管理标准构建要点

作物种质资源表型鉴定、作物重要性状形成机制基础研究以及加速育种等研究,均需要开展多年、多点的作物表型数据获取试验。除了环境的多样性、品种和栽培管理措施以及表型数据采集标准的一致性,表型数据如何有效地存储、管理和共享,是表型数据能否流通和增值的重要环节,这也是当前国际上组建表型网络(如国际植物表型网络、欧洲植物表型网络和中国植物表型网络等)的初衷之一。

利用传感器和表型平台,按照数据采集标准,可得到作物表型组大数据。然而,作物表型组大数据也存在着数据流通困难、数据监管不足等问题,致使数据孤岛现象严重,数据质量低下,数据要素潜能难以释放。这些大数据需要按照统一的标准进行存储和管理,以实现数据的共享、检索和应用。

目前国际上已经开展了相关标准的制定[13],这里进行简要探讨。作物表型组数据存储管理规范重点关注数据格式、数据质量和数据的完整性。其中,数据格式方面需要确定如RGB图像、点云、光谱数据的格式无需使用者进行格式转换即可使用;数据质量方面,通过制定相关规范,限定什么水平的数据是高质量数据,是否按照相关数据采集标准获取等;数据完整性方面,数据需要包含配套的品种、栽培管理方式、环境气象、获取平台、获取人员、获取时间等信息,便于后续使用。此外,应研究数据信任模型,以促进数据保护和数据重用。作物表型数据存储管理标准可指导作物表型组数据库的构建[3839],并将有助于推动形成类似于Github的作物表型数据共享云平台,真正实现作物表型大数据的共享和应用。高度结构化的表型组大数据可以与对应的基因和环境数据整合[40],通过多组学分析研究提高知识发现的效率。

表1整理了标准体系涉及的主要要素,包括硬件装备、数据采集、数据存储和管理、表型组织机构等。该清单可以为相关的立法、立项、评估和数据管理计划的制定提供参考。

5 讨论与展望

5.1 标准体系构建对于作物表型全流程的促进作用

作物表型组学的核心是获取好的表型组大数据。作物表型组大数据的产生到应用(图5)是通过研发传感器、成像单元和表型平台等数据获取技术及装备,获取作物的RGB图像、光谱影像、3D点云以及传统人工测量等的初始表型数据,进一步通过图像分割、点云配准、深度学习等表型解析算法,得到形态结构、颜色纹理、生理生化和生育动态表型指标,形成作物表型组数据库,并开展种质资源表型鉴定、多组学关联分析、田间生产管理决策等应用。然而,作物表型组大数据的产生是有生命周期的,低质量的表型数据或获取了数据而不分析利用,就难以发挥其应有的价值。

开发作物表型组大数据技术及装备以及制定作物表型标准规范,都是为了最大限度地挖掘和利用作物表型组大数据的价值。作物表型标准体系的构建对作物表型全流程有如下4个重要促进作用(图5):①可以规范并指导作物表型获取装备的研发,提高表型获取过程效率和稳定性;②可以规范并指导作物表型数据获取流程,提高初始表型数据一致性、保证数据质量;③可以为表型解析算法提供结构化、高质量的数据,提高表型解析的管道化处理能力和自动化水平;④可以规范并指导作物表型组数据库的建设,促进表型组大数据的存储、管理、分享和应用。

通量和精度是作物表型的两个重要指标,在单一环节同时提升通量和精度非常具有挑战。表型标准体系对整个流程进行了规范,包括对表型平台硬件进行规范,有益于提高通量;以及对表型数据获取进行规范,提高数据质量,进而提升表型精度。此外,高质量、全覆盖的表型大数据才能支撑人工智能中大模型的构建,推动农业领域通用人工智能的发展。整体而言,作物表型组大数据技术及装备标准的制定,将有助于引领作物表型组学学科的发展,扶植作物表型产业,并间接助力数字育种和智慧栽培的研究与应用的发展。

5.2 标准体系构建的评价方式

作物表型组大数据技术及装备标准体系构建的目标是支撑作物表型产业高质量发展,因此标准体系构建过程中需要思考什么样的产品是好的表型产品。在我们看来,好的表型产品应该是好用的、能用的起的(affordable),同时应该符合农业专业大学或专科毕业生等主要用户使用习惯,具有高通量、自动化、批处理等能力的能够真正解决农业科研与生产的表型信息获取痛点问题。因此,在制定标准过程中,需要结合实际需求和情况,构建符合各国国情的作物表型标准体系。

在作物表型相关标准制定过程中,同样需要思考如何评价标准及标准体系的好或不好。在硬件层面,评价标准体系主要看传感器、成像单元和表型平台之间是否能方便地集成;在数据获取层面,主要看数据质量;在数据存储、管理和应用层面,主要看数据是否能应用并流通起来。最重要的是,表型标准体系需要经得起验证,需要大部分表型科研、用户和产品研发等参与人员接受,从而最终促进表型组学及行业的健康发展。

5.3 标准体系构建过程中的建议

作物表型组学是一个交叉学科,涉及农学、自动化、机械工程、图形图像、遥感、生物信息学等多学科。因此,作物表型大数据技术及装备标准体系的构建需要多学科研发人员参与制定,同时需要参考借鉴工业传感器、农机装备、5G通信、大数据管理存储等其他领域成熟标准的兼容性。作物表型标准体系属农业领域,由于农业领域的复杂性,作物表型标准需要在一定程度上放弃普适性,在牺牲一些个性化指标的前提下才能形成标准。后续在标准体系整体框架确定的前提下,标准需要面向作物育种及栽培等特定的应用进行拓展和延伸。

作物表型组大数据技术及装备标准体系的构建和标准规范的制定是一个复杂的过程,需要多学科研发人员和用户不断沟通,针对作物表型产业全流程的框架和衔接过程制定规范,并不断改进和完善。标准体系中内容较多,建议选择需求旺盛、关注最多的环节作为切入点制定标准,优先制定产业链前端相关标准规范,并在企业和科研院所进行应用,在过程中逐步完善。关于不同国家的表型标准问题,必须充分考虑各国表型标准的制定工作。一旦达到一定的目标,国际表型组织就有义务在实施过程中实现各国标准的统一。

作物表型标准体系的制定类似于产业的润滑剂,能够更好地服务于表型组大数据技术及装备的开发和应用,其有助于作物表型组大数据技术及装备成为一个高效运转的系统,有益于作物表型组大数据资产的治理,对作物育种和智慧栽培等具有重要的推进作用,并能够促进农业增值赋能。

参考文献

[1]

Osinga SA, Paudel D, Mouzakitis SA, Athanasiadis IN. Big data in agriculture: between opportunity and solution. Agric Syst 2022;195:103298. . 10.1016/j.agsy.2021.103298

[2]

Araus JL, Cairns JE. Field high-throughput phenotyping: the new crop breeding frontier. Trends Plant Sci 2014;19(1):52‒61. . 10.1016/j.tplants.2013.09.008

[3]

Furbank RT, Tester M. Phenomics-technologies to relieve the phenotyping bottleneck. Trends Plant Sci 2011;16(12):635‒44. . 10.1016/j.tplants.2011.09.005

[4]

Zavafer A, Bates H, Mancilla C, Ralph PJ. Phenomics: conceptualization and importance for plant physiology. Trends Plant Sci 2023;2439(9):1004‒13. . 10.1016/j.tplants.2023.03.023

[5]

Zhao C, Zhang Y, Du J, Guo X, Wen W, Gu S, et al. Crop phenomics: current status and perspectives. Front Plant Sci 2019;10:714. . 10.3389/fpls.2019.00714

[6]

Jin X, Zarco-Tejada PJ, Schmidhalter U, Reynolds MP, Hawkesford MJ, Varshney RK, et al. High-throughput estimation of crop traits: a review of ground and aerial phenotyping platforms. IEEE Geosci Remote Sens Mag 2020;9 (1):200‒31. . 10.1109/mgrs.2020.2998816

[7]

Yang W, Feng H, Zhang X, Zhang J, Doonan JH, Batchelor WD, et al. Crop phenomics and high-throughput phenotyping: past decades, current challenges, and future perspectives. Mol Plant 2020;13(2):187‒214. . 10.1016/j.molp.2020.01.008

[8]

Sun D, Robbins K, Morales N, Shu Q, Cen H. Advances in optical phenotyping of cereal crops. Trends Plant Sci 2021;27(2):191‒208. . 10.1016/j.tplants.2021.07.015

[9]

Ninomiya S. High-throughput field crop phenotyping: current status and challenges. Breed Sci 2022;72(1):3‒18. . 10.1270/jsbbs.21069

[10]

Araus JL, Kefauver SC, Zaman-Allah M, Olsen MS, Cairns JE. Translating high-throughput phenotyping into genetic gain. Trends Plant Sci 2018;23 (5):451‒66. . 10.1016/j.tplants.2018.02.001

[11]

Zhao C. Big data of plant phenomics and its research progress. J Agric Big Data 2019;1:5‒14. Chinese.

[12]

Deng CH, Naithani S, Kumari S, Cobo-Simon I, Quezada-Rodriguez EH, Skrabisova M, et al. Agricultural sciences in the big data era: genotype and phenotype data standardization, utilization and integration. DATABASE‒OXFORD 2023;2023:baad088. . 10.1093/database/baad088

[13]

Papoutsoglou EA, Faria D, Arend D, Arnaud E, Athanasiadis IN, Chaves I, et al. Enabling reusability of plant phenomic datasets with MIAPPE 1.1. New Phytol 2020;227(1):260‒73. . 10.1111/nph.16544

[14]

Reynolds D, Baret F, Welckere C, Bostrom A, Ball J, Cellini F, et al. What is cost-efficient phenotyping? Optimizing costs for different scenarios. Plant Sci 2019;282:14‒22. . 10.1016/j.plantsci.2018.06.015

[15]

Wang W, Guo W, Le L, Yu J, Wu Y, Li D, et al. Integration of high-throughput phenotyping, GWAS, and predictive models reveals the genetic architecture of plant height in maize. Mol Plant 2023;16(2):354‒73. . 10.1016/j.molp.2022.11.016

[16]

Wolfert S, Ge L, Verdouw C, Bogaardt MJ. Big data in smart farming—a review. Agric Syst 2017;153:69‒80. . 10.1016/j.agsy.2017.01.023

[17]

Song P, Wang J, Guo X, Yang W, Zhao C. High-throughput phenotyping: breaking through the bottleneck in future crop breeding. Crop J 2021;9 (3):633‒45. . 10.1016/j.cj.2021.03.015

[18]

Watson A, Ghosh S, Williams MJ, Cuddy WS, Simmonds J, Rey MD, et al. Speed breeding is a powerful tool to accelerate crop research and breeding. Nat Plants 2018;4(1):23‒9. . 10.1038/s41477-017-0083-8

[19]

Wilkinson MD, Dumontier M, Aalbersberg IJ, Appleton G, Axton M, Baak A, et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci Data 2016;3(1):160018. . 10.1038/sdata.2016.18

[20]

Pommier C, Michotey C, Cornut G, Roumet P, Duchêne E, Flores R, et al. Applying FAIR principles to plant phenotypic data management in GnpIS. Plant Phenomics 2019;2019:1671403. . 10.34133/2019/1671403

[21]

Krajewski P, Chen D, Cwiek H, van Dijk ADJ, Fiorani F, Kersey P, et al. Towards recommendations for metadata and data handling in plant phenotyping. J Exp Bot 2015;66(18):5417‒27. . 10.1093/jxb/erv271

[22]

Cwiek-Kupczynska H, Altmann T, Arend D, Arnaud E, Chen DJ, Cornut G, et al. Measures for interoperability of phenotypic data: minimum information requirements and formatting. Plant Methods 2016;12:44. . 10.1186/s13007-016-0144-4

[23]

Ugochukwu AI, Phillips PWB. Data sharing in plant phenotyping research: perceptions, practices, enablers, barriers and implications for science policy on data management. Plant Phenome Journal 2022;5(1):e20056. . 10.1002/ppj2.20056

[24]

Fan J, Li Y, Yu S, Gou W, Guo X, Zhao C. Application of internet of things to agriculture—the LQ-FieldPheno platform: a high-throughput platform for obtaining crop phenotypes in field. Research 2023;2023:0059. . 10.34133/research.0059

[25]

Du J, Fan J, Wang C, Lu X, Zhang Y, Wen W, et al. Greenhouse-based vegetable high-throughput phenotyping platform and trait evaluation for large-scale lettuces. Comput Electron Agric 2021;186:106193. . 10.1016/j.compag.2021.106193

[26]

Wu S, Wen W, Wang Y, Fan J, Wang C, Gou W, et al. MVS-Pheno: a portable and low-cost phenotyping platform for maize shoots using Multiview stereo 3D reconstruction. Plant Phenomics 2020;2020:1848437. . 10.34133/2020/1848437

[27]

Cai S, Gou W, Wen W, Lu X, Fan J, Guo X. Design and development of a low-cost UGV 3D phenotyping platform with integrated LiDAR and electric slide rail. Plants 2023;12(3):483. . 10.3390/plants12030483

[28]

Xiong X, Yu L, Yang W, Liu M, Jiang N, Wu D, et al. A high-throughput stereo-imaging system for quantifying rape leaf traits during the seedling stage. Plant Methods 2017;13:7. . 10.1186/s13007-017-0157-7

[29]

Yang W, Guo Z, Huang C, Duan L, Chen G, Jiang N, et al. Combining high-throughput phenotyping and genome-wide association studies to reveal natural genetic variation in rice. Nat Commun 2014;5:5087. . 10.1038/ncomms6087

[30]

Zhang Y, Wang J, Du J, Zhao Y, Lu X, Wen W, et al. Dissecting the phenotypic components and genetic architecture of maize stem vascular bundles using high-throughput phenotypic analysis. Plant Biotechnol J 2020;19(1):35‒50. . 10.1111/pbi.13437

[31]

Du JJ, Lu XJ, Fan JC, Qin YJ, Yang XZ, Guo XY. Image-based high-throughput detection and phenotype evaluation method for multiple lettuce varieties. Front. Plant Sci. 2020;11:563386. . 10.3389/fpls.2020.563386

[32]

Gao J, Hu X, Gao C, Chen G, Feng H, Jia Z, et al. Deciphering genetic basis of developmental and agronomic traits by integrating high-throughput optical phenotyping and genome-wide association studies in wheat. Plant Biotechnol J 2023;21(10):1966‒77. . 10.1111/pbi.14104

[33]

Zhang X, Huang C, Wu D, Qiao F, Li W, Duan L, et al. High-throughput phenotyping and QTL mapping reveals the genetic architecture of maize plant growth. Plant Physiol 2017;173(3):1554‒64. . 10.1104/pp.16.01516

[34]

Miao T, Wen W, Li Y, Wu S, Zhu C, Guo X. Label3DMaize: toolkit for 3D point cloud data annotation of maize shoots. Gigascience 2021;10(5):giab031s. . 10.1093/gigascience/giab031

[35]

Li Y, Wen W, Fan J, Gou W, Gu S, Lu X, et al. Multi-source data fusion improves time-series phenotype accuracy in maize under a field high-throughput phenotyping platform. Plant Phenomics 2023;5:0043. . 10.34133/plantphenomics.0043

[36]

Wu D, Yu LJ, Ye JL, Zhai RF, Duan LF, Liu LB, et al. Panicle-3D: a low-cost 3D-modeling method for rice panicles based on deep learning, shape from silhouette, and supervoxel clustering. Crop J 2022;10(5):1386‒98. . 10.1016/j.cj.2022.02.007

[37]

Liang X, Xu X, Wang Z, He L, Zhang K, Liang B, et al. StomataScorer: a portable and high-throughput leaf stomata trait scorer combined with deep learning and an improved CV model. Plant Biotechnol J 2022;20(3):577‒91. . 10.1111/pbi.13741

[38]

Neveu P, Tireau A, Hilgert N, Negre V, Mineau-Cesari J, Brichet N, et al. Dealing with multi-source and multi-scale information in plant phenomics: the ontology-driven Phenotyping Hybrid Information System. New Phytol 2019;221(1):588‒601. . 10.1111/nph.15385

[39]

Reynolds D, Ball J, Bauer A, Davey R, Griffiths S, Zhou J. CropSight: a scalable and open-source information management system for distributed plant phenotyping and IoT-based crop management. Gigascience 2019;8(3):giz009. . 10.1093/gigascience/giz009

[40]

Xu Y, Zhang X, Li H, Zheng H, Zhang J, Olsen MS, et al. Smart breeding driven by big data, artificial intelligence, and integrated genomic-enviromic prediction. Mol Plant 2022;15(11):1664‒95. . 10.1016/j.molp.2022.09.001

AI Summary AI Mindmap
PDF (2461KB)

2317

访问

0

被引

详细

导航
相关文章

AI思维导图

/