基于随机森林集成学习的土地覆被分类技术
1、 概述
土地覆被是地球表面自然景观和人工营造物所覆盖的地表诸要素的综合体,包括林地、绿地、草地、水域、湖泊、建筑物、湿地等不同类型,具有特定的时间和空间属性,形态和状态可在多种时空尺度上变化。区域范围内土地覆被类型的空间分布不仅最密切地反映区域物质资源本底、环境质量状况及经济活动强度,其变化动态更是地域自然过程与人为活动引发区域或全球性生态安全、气候效应等问题的最直接指征。
遥感土地覆被分类是识别与区分地表空间类型要素组成单元的过程,基于此数据分析推理可得到多视角、深层次的地表信息。关于土地覆被分类制图研究,较具代表性的有美国马里兰大学的全球森林变化制图、欧空局的全球陆地覆盖制图(ESA GlobCover)、国家基础地理信息中心的GlobeLand30产品以及清华大学土地覆被数据FROM-GLC10,多以全球尺度免费共享产品发布为目标,具有良好的应用。但是,上述数据的分类和精度评价多数到一级地类,且限于某个年份,精度较差。此外还有一些基于人工解译的商业土地覆被数据产品,数据分级到二级类,但是数据收费,获取代价较大。
为此,我们利用中高分辨率对地观测卫星影像与智能化分类算法,构建高性能计算环境下遥感大数据地表分类与场景识别处理系统和自动化、规模化的土地覆被生产作业系统,基于十米级高分辨率遥感资料,快速完成下垫面全要素分类及异常场景的检测识别,精细重建目标区域地表覆被数据库,形成了自主的高精度的区域地表覆盖数据研制技术体系,以生产不同时间和空间尺度的土地覆被产品。
2、技术应用场景
土地覆被及生态环境变化信息的获取,可为生态数值建模、自然资产核算、环境健康诊断、安全应急管理、能源开发利用与国土发展规划等等的必要条件。具体应用场景如下:
Ø 生态系统(管理和保护陆表、海岸带资源及生态服务功能评价)
Ø 灾害(评估自然和人为灾害导致的损失)
Ø 天气(更新陆面过程模式,提高天气信息预测性能)
Ø 气候(理解、评估、预测、减轻和适应气候波动和变化)
Ø 卫生(了解影响人类健康和福祉的环境因素)
Ø 能源(改善能源管理)
Ø 农业(支持可持续农业、粮食安全保障)
Ø 生物多样性(理解、监测和保护生物多样性)
Ø 人地关系(城市精细化管理、生态文明建设与绩效考核)
3、 技术特点
构建高性能计算环境下遥感大数据处理框架,实现卫星数据提取、格式转换、重投影、云(阴影)检测等快速一体化预处理,同时设计具有应用针对性的下垫面精细类型分类体系,建设扩增土地覆盖土地利用类型及场景样本库,通过光谱、纹理等多特征参数优化及随机森林机器集成学习方案完成分类模型递进更新训练,以及基于光谱斜率差异的变化检测算法实现地物要素变化检测,并进行顾及时空关系的结果验核及后处理。现已研制完成华东区域首套高精度多分类级别(21类)的30m地表覆被季相图谱。产品与国内基础地理信息中心、清华大学、遥感所等主要针对全球与国家尺度,基本以大类(6-10类)为主的土地覆被分类产品相比,具有时相新、精度高、分类细、具有季相变化特点,在面向城镇尺度的城市生态评估、灾害调查、模式模拟等精细化应用方面优势显著。