《1 引言》

1 引言

土壤湿度监测在农业、水利、水文学等领域有着十分重要的意义。主动和被动微波遥感与其他遥感手段相比, 具有全天候、全天时的优点, 因而被广泛运用于大范围内的土壤湿度监测。

利用微波遥感数据进行裸土壤湿度监测的主要处理方法有模型法、经验公式法和半经验半模型法, 后两种方法由于其对已知测量数据的针对性强, 所以适用范围很窄, 本文针对模型法进行研究。所谓模型法是指依据随机粗糙面的散射模型、发射模型以及土壤介电常数模型, 从散射系数数据 (主动微波遥感) 和亮温度数据 (被动微波遥感) 中反演地表土壤湿度的方法。通常, 发射模型建立在散射模型的基础上。微波遥感的实践就是利用散射计或者辐射计在高空对所监测区域进行测量, 所得到的测量数据是散射系数或亮温度。相对于主动微波遥感而言, 被动微波遥感反演土壤湿度具有一些特点:遥感设备采集的数据是地面的亮温度, 机载或星载遥感设备是辐射计, 该设备比雷达简单、消耗能量少, 覆盖地面范围大、数据量较少, 粗糙面的发射率模型比散射模型更复杂。

给定粗糙面几何和物理参数, 例如粗糙面的相关长度和高度起伏方差、粗糙面的介电常数等, 可由随机粗糙面的散射模型计算粗糙面的散射系数和发射率, 这是遥感的正问题。目前, 比较成功的模型有基尔霍夫模型 (KM) [1]、小扰动模型 (SPM) [1]、积分方程模型 (IEM) [2]和双谱散射模型 (bi-spectrum scattering model, BSM) [3,4]等。刘宁博士在2001年提出BSM模型[3,4], 其计算表明, BSM的适用范围和精确程度上均优于KM和SPM, 与IEM相当, 但计算量比IEM略小, 本文采用BSM模型作为被动微波遥感的基础。

针对裸土壤这种特殊的媒质, 近年来人们提出了不少的裸土壤介电常数模型, 这些模型提供了由土壤质地、土壤湿度和土壤温度等知识计算土壤的等效介电常数的方法。在这些模型中, Schmugge和Wang建立的四成分模型[5,6]所需参数较少, 物理意义明确, 因此得到广泛应用, 本文关于土壤等效介电常数的计算即采用该模型。

随机粗糙面散射模型给出的散射系数和发射率计算公式十分复杂, 而且是非线性的。在结合了土壤的介电常数模型后, 所得到的公式更为复杂, 由这些计算公式直接逆推得到土壤湿度是不可能的。在实际的反演中, 为了从散射系数和发射率数据中获得土壤湿度, 需采用非线性映射的方法。近年来, 采用人工神经网络 (ANN) 进行反演的方法受到关注[7]。将其用于土壤湿度反演, 能够绕开寻找复杂非线性的逆映射显式的困难, 顺利地解决土壤湿度遥感的逆问题, 本文就利用人工神经网络从被动微波遥感数据中提取土壤湿度信息, 并进一步讨论被动微波遥感土壤湿度反演中的先验知识问题。

在依据随机粗糙面的散射模型计算粗糙面的散射系数和发射率时, 土壤质地, 土壤表面的高度起伏相关函数形式、相关长度和高度起伏方差是给定的;而在被动反演土壤湿度时, 假定土壤质地、土壤表面的相关函数是已知的, 同时还需假定土壤的物理温度是已知的, 因为发射率是亮温度与地面物理温度之比。所有这些假定的预估的已知参数, 需要预先抽样测量, 预先获取或预先估计, 故我们称之为先验知识。没有先验知识无法进行土壤湿度反演, 而先验知识的获取、测量和估计可能存在较大的误差, 这将会影响到反演结果的精度和准确性。评价先验知识对被动微波遥感反演裸土壤湿度的影响是本文的主要工作。事实上这些先验知识又是很难准确获取的, 例如对于土壤的高度起伏相关函数形式, 常见的有高斯形式和指数形式, 然而实测时只能采样分析, 分析结果的准确与否直接和采样点的个数与采样地的选取有关。虽然很难全部准确获取所有的先验知识, 但是各种类型的先验知识对于反演结果的影响大小不一样, 所以可以采取对影响大的先验知识尽可能精确测量, 对影响小的仅粗略估计的方法, 使得实际的遥感实践更加准确有效。

本文所考虑的先验知识是指有关被测对象的一些参数, 主要包括:a.土壤表面的高度起伏相关函数形式, 对高斯型和指数型两种常见形式进行对比;b.土壤的物理温度; c.土壤的质地。这是土壤湿度遥感反演中最重要的三类先验知识, 缺少这些先验知识将无法从发射率反演出地面的土壤湿度, 本文分别计算分析这三类先验知识对土壤湿度反演的影响, 所谓影响指的是先验知识的不准确, 或不确定性引起的土壤湿度反演的误差。结果表明, 在先验知识具有不确定性时被动微波遥感反演土壤湿度仍可保证一定的反演精度。

《2 基于BSM模型利用ANN反演土壤湿度的方法》

2 基于BSM模型利用ANN反演土壤湿度的方法

实验研究表明[8], 自然的裸土地或农田耕地表面起伏很接近高斯平稳过程的假设, 因而一般用平稳高斯随机过程来描述它们。由于高斯随机过程是二阶矩过程, 其表面相关谱和表面高度的概率密度函数是一一对应的。BSM最核心的思想就是在谱域将表面相关谱分解成两部分, 一部分适合用KM进行分析, 另外一部分适合用SPM进行分析, 其名称中“双谱”的含义也在于此。

BSM散射系数σqp0的表达为[4]:

σqp0=k024π{exp?[-(kiz-ksz)2σ2ρk(0,0)]}|fqp|2{exp?[(kiz-ksz)2σ2ρk(u,v)]-1}exp?[-j(kix-ksx)u-j(kiy-ksy)v]dudv+1πk02σ2(cos2θs)|αqp|2exp?[-(kiz-ksz)2σ2ρk(0,0)]ρs(u,v)exp[(kiz-ksz)2σ2ρk(u,v)]exp[-j(kix-ksx)u-j(kiy-ksy)v]dudv(1)

其中, fqpαqp分别是BSM模型的基尔霍夫场系数和小扰动场系数, σ为表面高度标准方差, ρk (u, v) 和ρs (u, v) 分别是基尔霍夫表面和小扰动表面的高度起伏相关函数, kix, kiykiz分别是入射波数kix, yz方向分量, ksx, ksyksz分别是散射波数ksx, yz方向分量, θs为散射角。

在热平衡条件下, 根据互易定理, 通过对双站散射半空间积分可以得到随机粗糙表面的发射率与散射系数的如下关系[2]:

ep(θ,ϕ)=1-Γp(θ)(2)Γp(θ)=Γp0(θ)exp?(-hcos2θ)+14πcosθ02π(σpp0(Ωs;Ω)+σqp0(Ωs;Ω))dΩs(3)

其中Γ0p (θ) 为光滑平面的菲涅尔反射率, h=4k2σ2, k为自由空间波数。式 (3) 中的散射系数采用公式 (1) 计算。

利用ANN研究先验知识的影响, 其主要步骤是:

1) 利用散射和发射模型计算出的数据训练ANN, 并计算训练好的ANN的系统误差, 该项误差用ΔS表示, 从而判断该ANN是否可用。

2) 保持先验知识不变, 用检验数据集1计算ANN的反演RMS误差, 该项误差用Δ1表示。

3) 改变先验知识, 用检验数据集2计算ANN的反演RMS误差, 该项误差用Δ2表示。

4) 分析以上两步的反演误差, 计算先验知识不准确 (或不确定) 引入的误差。

下面简要说明训练步骤和反演步骤以及ANN的系统误差、ANN的反演误差、先验知识不准确 (或不确定) 引入的误差等概念和计算公式。

首先, 利用模型计算出来的数据对ANN进行训练, 使得ANN的特性与模型接近, 然后可以利用训练后的ANN代替模型进行反演。实际操作中, 所使用的ANN有三层, 输入层有两个神经元, 它们代表反演时所需的两个输入数据。本文所考虑的裸土壤湿度的范围是mv∈[1%, 40%], 粗糙表面的相关长度的范围是l∈[0.02m, 0.3m], 高度方差的范围是σ∈[0.005m, 0.03m]。

ANN的训练数据共有4 800组, 它们是利用模型计算出来的, 计算时在 (mv, l, σ) 的三数据空间内均匀取点, 共取4 800个点, 对应于每一个数据点, 计算V极化的发射率数据eV和H极化的发射率数据eH, eVeH构成一组训练数据, 发射率数据对应的频率点为4.7 GHz。

ANN的训练程度和三类先验知识的影响大小都可用湿度反演误差来描述的, 本文中所提到的误差均指RMS误差, 用Δ表示, 其计算公式如下:

Δ=1Νn=1Ν[(m¯v)n-(mv)n]2(4)

其中m¯v是湿度的反演值, mv是湿度的真实值, n代表第n组数据, N代表数据组的总个数。为了区别不同种类的误差, 将对符号Δ附加相应的下角标, 下文将作具体说明。

用训练之后的ANN对训练数据进行反演, 其结果也不是绝对准确的, 因为ANN只是在最大的限度上对发射模型进行的非线性逼近。将原来的训练数据作为ANN反演时的输入数据, 反演得到的误差称为ANN的系统误差 (或称为ANN的固有误差) , 用符号ΔS表示, ΔS描述了在先验知识完全准确的条件下ANN的固有误差, 也代表了ANN对发射模型逼近程度的优劣。若ΔS比较小, 说明ANN对发射模型逼近的比较好;若ΔS比较大, 说明ANN对发射模型逼近的比较差。

在 (mv, l, σ) 的三维数据空间内均匀取点, 并且保证这些点和训练数据均不重合, 然后利用模型计算发射率, 从而得到检验数据。依据先验知识的正确与否可将检验数据分为两类:检验数据集1是先验知识正确时的检验数据;检验数据集2是改变先验知识时的获得的检验数据。用检验数据1进行反演, 得到土壤湿度mv的反演误差为Δ1, Δ1略大于ΔS, 但差别不大, 实际计算表明, Δ1ΔS的差异仅为0.01%的量级, 可以不予考虑, 一般认为Δ1ΔS。用检验数据2进行反演, 得到土壤湿度mv的反演误差为Δ2, Δ2又分为三种, Δ2corΔ2temΔ2cop, 分别对应了相关函数、土壤物理温度和土壤成分这三类先验知识的不准确对土壤湿度反演的影响, 下文将详细讨论。

《图1》

图1 基于4800组训练数据的ANN的
反演值与真实值的关系
Fig.1 The inversion moisture and the 
real moisture of an ANN trained by 
4 800 pairs of emissivity data

图1 基于4800组训练数据的ANN的 反演值与真实值的关系 Fig.1 The inversion moisture and the real moisture of an ANN trained by 4 800 pairs of emissivity data  

《3 三类先验知识的影响效果与分析》

3 三类先验知识的影响效果与分析

为了分析三类先验知识的影响, 首先利用散射和发射模型计算出的4 800组训练数据训练ANN, 然后基于同样的4 800组训练数据进行反演, 得出反演值与真实值的关系 (图1) 。由图1给出的数据可以计算已训练好的ANN的系统误差ΔS。若纵坐标用y表示, 横坐标用x表示, 图中的直线为y=x, 它代表理想情况下训练好的ANN的反演特性, 此时如果在反演时将训练数据作为输入数据, 反演结果是完全没有误差的, 但这是不可能做到的, 可以用ANN的系统误差ΔS描述这一现象。图中的黑点代表了实际的反演结果, 对于某一特定的湿度真实值, 不同粗糙度情况下的输入数据的反演值是不同的, 它们相对于真实值向两侧扩散。对4 800组训练数据的误差统计结果表明, 湿度误差值变量 (即反演值减去真实值) 以95 %的置信度服从均方差为1.0×10-2的正态分布, 即每个反演值平均有1 %的湿度误差, 这就是本文ANN的系统误差ΔS, 实际应用中, 是完全可以接受的。

《3.1土壤表面相关函数形式的影响》

3.1土壤表面相关函数形式的影响

在现有的随机表面散射理论研究中, 常用的高度起伏相关函数包括高斯型、指数型、混合型和1.5次幂型四种。其中高斯型和指数型研究得较多, 本文将对这两种相关函数进行讨论。

在先验假设中, 我们认为土壤表面的高度起伏相关函数的形式为高斯型的, 即

ρ(x,y)=exp(-x2+y2L2)(5)

式中L为相关长度。预先假定土壤表面为高斯型相关函数, ANN训练时就采用高斯型相关函数的土壤表面计算出来的数据, 而实际的土壤表面高度起伏相关函数是指数型, 即

ρ(x,y)=exp(-x2+y2L)(6)

表明, 土壤表面相关函数的先验知识不准确, 利用原先训练好的ANN反演土壤湿度时, 将会出现由 于此类先验知识不准确引入的湿度误差, 记为Δ2cor, 它是Δ2的一种。

图2给出了实际土壤表面相关函数为高斯型和指数型时, 由ANN反演出的土壤湿度 (训练时采用高斯型相关函数, 反演时采用指数型相关函数) 。除了高度起伏相关函数不同之外, 两个检验数据集的其他因素都相同。高斯型的数据集的反演值都集中在直线y=x附近, 扩散距离很小, 相应的均方差为Δ1=σ1=1.02×10-2;指数型数据集的扩散比较严重, 极少数数据的反演值误差几乎达到15%, 相应的均方差为Δ2cor=σ2=3.2×10-2。二者之差记作δcor, δcor=Δ2cor-Δ1=2.2%。这就是说, 高度起伏相关函数的形式不确定将带来附加的2.2%的湿度反演误差。

《3.2土壤物理温度的影响》

3.2土壤物理温度的影响

假定的土壤物理温度的不准确将会影响到土壤等效介电常数的变化, 从而影响土壤湿度反演结果的准确性。本文, 首先设定土壤温度的先验知识为20 ℃, 利用20 ℃的数据对ANN训练, 并进行反演, 然后再假设土壤温度为40 ℃进行反演。图3a给出了土壤温度分别是20 ℃和40 ℃时湿度反演的对比结果, 在图中用深黑色的点代表20 ℃的结果, 浅黑色的点代表40 ℃的结果。当湿度大于20%时, 40 ℃的湿度反演值相对于20 ℃向下移动, 温度变化所产生的影响明显可见。通过统计分析, 发现20 ℃的温度误差引起的湿度反演误差Δ2tem=0.6%。图3b给出了随温度变化而改变的反演误差Δ2tem曲线。在[5 ℃, 45 ℃] 的温度范围内, 实

《图2》

图2 反演结果的影响
Fig.2 The influence of type of soil surface height distribution on inversion result

图2 反演结果的影响 Fig.2 The influence of type of soil surface height distribution on inversion result  

际温度比先验温度每升高10 ℃, 带来的湿度误差量约为0.3%。在[5 ℃, 45 ℃]的温度范围内, 实际温度比先验温度低时, 所带来的湿度误差量则很小。

《图3》

图3 土壤温度对反演结果的影响
Fig.3 The influence of soil temperature on moisture inversion

图3 土壤温度对反演结果的影响 Fig.3 The influence of soil temperature on moisture inversion  

《3.3土壤质地的影响》

3.3土壤质地的影响

本文所假定的土壤为砂质粘土, 这种土壤的含沙量为42%, 粘土含量为8.5%, 粉土含量为49.5%。为了研究土壤质地对ANN反演精度的影响, 选取了不同于砂质粘土的其他四种典型的土质作为实际的土壤质地, 分别产生检验数据集, 对训练好的ANN进行检验。表1分别给出了其他四种土壤的土壤质地情况以及它们产生的湿度误差大小Δ2cop, Δ2copΔ2的一种。图4是这四种土壤的反演结果对比, 从图中可以看出, 与标准土壤即砂质粘土的质地差别越大的土壤, 其反演误差越大, 质地相差最大的粉质粘土, 其反演误差达到6.4%。

表1 不同土质的检验数据集的统计反演误差 Table 1 The inversion errors of 4 kinds of soil texture

《表1》

土质土壤成分/%Δ2cop
/%
含沙量粘土含量粉土含量
砂壤土 51.513.535.00.2
粉砂壤土130.613.555.90.6
粉砂壤土217.219.063.81.8
粉质粘土5.047.447.66.4

《4 结论》

4 结论

利用被动微波遥感数据反演土壤湿度, 三类先

《图4》

图4 四种典型土壤的反演结果对比
Fig.4 The inversion result of 4 kinds of soil texture

图4 四种典型土壤的反演结果对比 Fig.4 The inversion result of 4 kinds of soil texture  

验知识中土壤质地对反演的影响最为严重, 其次是土壤表面高度起伏相关函数的形式, 最后才是土壤的物理温度。土壤表面高度起伏的相关函数形式和土壤的表面形状有关, 电磁波在不同相关函数的土壤表面上的散射和折射情况也必定是不同的。土壤的物理温度和土壤质地都将影响到土壤的等效介电常数, 进而影响到电磁波在土壤表面上的散射与折射, 因而这两类先验知识对土壤湿度反演的影响机理是一样的。相比而言, 土壤质地对土壤等效介电常数的影响显然要比土壤物理温度大得多, 土壤质地变化越大, 湿度误差就越大, 计算结果也证实了这一点。

结果表明, 基于BSM散射和发射模型与人工神经网络 (ANN) 的土壤湿度的反演方法是可行的。向ANN输入两种极化的裸土壤表面发射率数据便可反演出裸土壤的湿度, 并且在先验知识具有不确定性时仍可保证一定的土壤湿度反演准确度。

由于土壤质地对反演结果影响很大, 在利用遥感反演土壤湿度的实践中, 应该尽可能准确地获取测量对象的土壤质地。实际上, 国家可以建立一个土壤质地数据库, 将全国各地的土壤质地进行记录, 以适应土壤湿度观测预报的需求。