本小节介绍城市地上生物量遥感反演的总体技术流程,如图18-9所示。
图18-9 城市地上生物量反演技术流程图
(1)以城市区域内典型样区野外实地调查的地上生物量参数计算样地的地上生物量,利用样地的生物量与机载LiDAR提取的高度信息等变量采用回归法估算典型样区的地上生物量,建立典型样区基于机载LiDAR的地上生物量估算模型。
(2)从机载LiDAR估算的地上生物量结果中提取样本数据,与从高分辨影像数据提取的波段反射率、植被指数以及纹理特征进行城市范围内地上生物量估算。
(3)利用遥感影像光学特征变量,以及分层随机采样获得的训练数据集,可采用随机森林(Random Forest,RF)构建城市地上生物量反演模型。
随机森林(RF)反演模型作为新型分类和预测算法,采用自助法重采样技术,从容量为N的训练集中有放回地随机抽取样本产生新的训练样本集,独立进行K次抽样,产生互相独立的自助样本集K个,从而产生的K个分类树构成随机森林。该方法实质是一种改进的决策树算法。
RF模型的具体实施步骤如下(图18-10):(www.xing528.com)
图18-10 随机森林算法过程
①基于自助法重采样技术,从大小为N的训练集中产生K个自助样本集,每棵树的全部训练数据即为每个自助样本集,每次没有抽取的样本构成K个袋外数据(Out-of-Bag,OOB)。
②单棵树由每个自助样本集生长而成,在树的各节点处,随机从M个特征中选择m个特征(m≤M),再从m个特征变量中挑选一个特征进行分支生长,这里的特征选择依据的是节点不纯度最小原则。这棵树最大限度生长,不做通常的修剪。
③根据多棵树构成的RF,对待测数据进行判别或预测,在分类问题中,分类树投票数产生的分数决定了分类结果;在回归问题中,则是将每棵树的估测值平均得到最终估测值。
随机森林算法作为一种组合学习算法,具有分类和预测速度快,大部分参数无需调整,对大样本数据处理效率高,不会出现过拟合现象,强大的抗噪能力以及能够对分类或预测变量的重要性进行排序等优点。由于简单有效,随机森林算法已经应用于植被结构参数,尤其在生物量的反演研究中,并取得了较好的效果。Baccini等(2008)基于MODIS数据和生物量地面实测值,采用RF算法首次成功估测了非洲森林生物量。Latifi等(2010)采用多光谱和LiDAR数据,对比了RF和KNN方法对森林生物量的估测效果,结果显示RF获得了最佳估测精度。Fassnacht等(2014)结合高光谱和LiDAR数据,对比了RF、KNN、SVM等五种预测算法的森林生物量估测精度,结果发现RF的反演精度优于其他预测模型。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。