其他数据论文 I 区论文(评审中) 版本 ZH3
下载
四川及周边滑坡泥石流灾害高精度航空影像及解译数据集
High-precision aerial imagery and interpretation dataset of landslide and debris flow disaster in Sichuan and surrounding areas
 >>
: 2021 - 01 - 27
: 2021 - 02 - 08
: 2021 - 02 - 08
216 0 0
摘要&关键词
摘要:本文以2008年以来,四川及周边滑坡泥石流灾害0.2 m~0.9 m高分辨率航空正射影像(DOM)数据为基础,采用目视解译方法,对灾害进行解译和样本标注,制作完成首套精度最高、最为典型的滑坡泥石流航空影像及解译数据集。数据集包含107处典型滑坡泥石流灾害影像图片、标注数据和描述文档,涉及地震滑坡、降雨滑坡、沟谷泥石流和坡面泥石流四种类型,空间范围覆盖“5·12”汶川地震、“4·20”芦山地震、“8·8”九寨沟地震等核心灾区,及金沙江和大渡河沿岸区域。明确的数据来源、地质灾害专家的解译标注和详实灾害信息相互印证,保障了本数据集的质量。与国内外现有的相关数据集相比,本数据集在数据源质量、数据集完备性和潜在应用等方面都更具价值,不仅可用于滑坡泥石流灾害的自动化解译,还可用于灾害分布规律、风险分析等研究工作。
关键词:滑坡泥石流灾害;高精度;航空影像及解译数据集;2008~2020年;0.2 m~0.9 m
Abstract & Keywords
Abstract: Based on the landslides and debris flow disasters high-resolution digital orthophoto map (with the resolution of 0.2 m~0.9 m) in Sichuan province and its surrounding area since 2008, this paper uses visual interpretation methods to extract landslides and debris flow disasters and label the disasters. A set of the most accurate and most typical aerial imagery and interpretation data sets of landslides and debris flows are developed. The data set contains 107 typical landslide and debris flow hazard images, annotation data and description files, involving four types of disasters, including earthquake landslides, rainfall landslides, gully debris flows and slope debris flows. The disasters selected for the data sets covers the “5·12” Wenchuan, “4·20” Lushan, “8·8” Jiuzhaigou earthquake affected area, as well as the areas along the Jinsha River and Dadu River. The quality of this data set is very good, because of high-precision image data sources, interpretation and annotations by geohazard experts, and detailed disaster information. Compared with previous relevant data sets, this data set is more valuable in terms of data source quality, data set completeness and potential applications. It can not only be used for automatic interpretation of landslides and debris flow disasters, but also for disaster distribution and risk assessment research.
Keywords: Landslide and debris flow disaster; high-precision;  aerial image and interpretation data set; 2008~2020;  0.2 m~0.9 m
数据库(集)基本信息简介
数据库(集)名称四川及周边滑坡泥石流灾害高精度航空影像及解译数据集
数据作者曾超, 曹振宇, 苏凤环, 曾珍, 余长锡
数据通信作者曾超(zeng3chao@163.com
数据时间范围2008–2020年
地理区域地理范围为97°20′50″E–108°32′33″E,26°02′53″N–34°18'54″N,地理区域范围包括四川省及其周边区域。
空间分辨率0.2 m~0.9 m
数据量266 MB
数据格式*.tif, *.xls
数据服务系统网址http://www.dx.doi.org/10.11922/sciencedb.j00001.00222
基金项目国家对地观测科学数据中心开放基金项目(NODAOP2020020),2019年自然资源部高层次创新人才培养工程杰出青年人才资助项目(12110600000018003934),四川省科技计划项目(2019YFH0038)。
数据库(集)组成数据集包含滑坡和泥石流两类灾害的航空正射影像图片数据、解译标注图片数据和描述文档,其中:(1) landslides.zip 是滑坡灾害影像及解译数据,数据量173 MB,共59处样本;(2) debris flow.zip 是泥石流灾害影像及解译数据,数据量93 MB,共48处样本。
Dataset Profile
TitleHigh-precision aerial imagery and interpretation dataset of landslide and debris flow disaster in Sichuan and surrounding areas
Data corresponding authorZeng Chao (zeng3chao@163.com)
Data author(s)Zeng Chao, Cao Zhenyu, Su Fenghuan, Zeng Zhen, Yu Changxi
Time range2008–2020
Geographical scopeSichuan Province and its surrounding areas (97°20′50″E–108°32′33″E,26°02′53″N–34°18'54″N)
Spatial resolution0.2 m~0.9 m
Data volume266 MB, 216 entries
Data format*.tif, *.xls
Data service systemhttp://www.dx.doi.org/10.11922/sciencedb.j00001.00222
Source(s) of fundingNational Earth Observation Science Data Center Open Fund Project (NODAOP2020020), 2019 Outstanding Young Talent Funding Project of the Ministry of Natural Resources High-level Innovative Talent Training Project(12110600000018003934), Sichuan Foundation of Excellent Scientists (2019YFH0038).
Dataset/Database compositionThe data set contains aerial orthophoto image data, interpretation image data and description files of landslide and debris flow disaster. Including: (1) landslides.zip is the landslide disaster image and interpretation image data, with a size of 173 MB and with 59 samples; (2) debris flow.zip is the debris flow disaster image and interpretation image data, with a size of 93 MB and with 48 samples.
引 言
滑坡泥石流灾害遥感自动化检测和提取,对开展灾害监测预警、风险评估、应急处置、灾害防治和灾情评估等工作具有极为重要的意义,同时也是灾害遥感领域的关键技术难点。由于灾害体自身特征、背景环境的复杂性,目前对滑坡泥石流灾害的提取多以目视解译为主[1,2]。近年来,以深度学习为代表的图像识别、目标检测等技术的发展, 为滑坡泥石流灾害的计算机自动化提取提供了机遇和前景[3,4]。然而,目前国内外可参考的相关数据集以灾害历史编目为主[1,5-6],编目数据仅以矢量点或面文件保存(缺少对应的影像图片),矢量文件也多从较低分辨率的卫星影像解译获取,且卫星影像质量受天气、地形等影响较大,使得现有滑坡泥石流灾害编目数据在完整性和精度方面都无法满足自动化提取需要。
2008年以来,有关部门和单位通过承担四川省及其周边突发滑坡泥石流灾害的应急测绘保障工作,以及实施国家和省地质灾害防治相关测绘生产、科研项目,积累了大量的滑坡泥石流灾害无人机和有人机航空影像数据,影像分辨率为0.05~1 m,获取时间为2008-2020年。然而,尚未对影像进行进一步的深加工和处理,未形成具有广泛应用前景的滑坡泥石流影像和解译数据集。项目拟通过对历年来积累的航空影像数据,进行深加工和处理,研制滑坡泥石流灾害高精度影像和解译标注数据集,为灾害的自动化检测和提取提供数据基础,以发挥数据对防灾减灾工作的重要支撑作用。
1   数据收集和处理方法
收集2008以来四川境内已发生的滑坡泥石流灾害的无人机和有人机航空正射影像数据,通过对数据的系统整理和统一处理,并采用ArcGIS软件及目视解译方法,对已发生的滑坡和泥石流灾害体进行解译和样本标注,并以单个灾害体为对象,制作完成共107处滑坡泥石流灾害高精度影像和解译样本标注数据集(其中滑坡59处,泥石流48处),编制与数据集对应的灾害信息描述文本,最后对数据质量进行检验和评估。主要技术路线如下(图1):


图1   数据集研制技术路线图
1.1   影像数据整理与处理
1.1.1   数据查询与整理
通过文献资料或互联网新闻等途径,查询2008年以来四川省及周边的重大滑坡泥石流灾害事件,收集灾害事件信息(如:灾害类型、发生时间、发生地点、规模、灾情等)。根据查找出的灾害事件发生的时间和地点,从历史影像数据库中挑选与灾害事件对应的航空影像数据,影像数据说明见表1。挑选影像遵循以下原则:
表1   影像数据说明
序号影像获取时间影像地面分辨率(m)灾害事件
12008年5月16日0.92008年“5·12”汶川地震次生地质灾害
22010年8月15日0.42010年“8·13”清平乡泥石流灾害
32013年4月21日0.22013年“4·20”芦山地震次生地质灾害
52013年7月13日0.22013年“7·10”特大山洪泥石流灾害
62013年7月20日0.62013年“7·10”特大山洪泥石流灾害
72016年1月20日0.22016年“1·19”绵竹小岗剑山体滑坡灾害
82017年6月26日0.22017年“6·24”茂县叠溪山体滑坡灾害
92017年8月11日0.22017年“8·8”九寨沟地震次生地质灾害
102018年10月12日0.22018年“10.11”金沙江白格山体滑坡灾害
112020年6月20日0.22020年“6.17”丹巴泥石流灾害
122020年8月24日0.22020年“8.20”平武县强降雨滑坡泥石流灾害
132020年8月26日0.22020年“8.20”平武县强降雨滑坡泥石流灾害
(1)需为灾害发生后的影像数据,影像获取与灾害发生时间间隔小于10天,避免因流水长时间的冲刷影响灾害体样本的完整性。
(2)需为较为典型的或重点地区的灾害影像,如:2008年“5·12”汶川地震、2013年“4·20”芦山地震、2013年“7·10特大山洪泥石流、2017年“6·24”茂县叠溪山体滑坡、2018年“10·11”金沙江山体滑坡等。
(3)影像数据分辨率需优于1 m,多数优于0.5 m,且无云层或其他遮挡物覆盖。
1.1.2   数据处理
完成影像数据的坐标转换、影像匹配、影像拼接和融合等处理。
(1)坐标转换。影像数据统一采用2000国家大地坐标系(CGCS2000),地理坐标以度为单位,用双精度浮点数表示。高程采用1985国家高程基准,单位为米。将挑选后的影像数据的平面坐标统一转换为CGCS2000。
(2)影像匹配。以基本比例尺地形图或基础测绘生产的高质量数字正射影像(DOM)为基准,对经过坐标转换后的影像数据进行匹配,完成影像数据的几何纠正。
(3)影像拼接。对同一区域连续分布,且获取时间相同的多幅影像数据进行拼接。尽可能保证分布在不同图幅的同一个灾害体的完整性。
(4)影像融合。对影像数据的色调、重影、噪声等进行必要的处理,使影像清晰、纹理丰富、反差适中、色调均衡,无明显接边痕迹,无模糊、错位、拉伸、扭曲等现象,保证不同图幅影像之间色调基本一致。
1.2   滑坡泥石流解译与标注
为保证数据集的精度和准确性,本文解译和标注的滑坡泥石流灾害主要满足几项条件:①所见所得,解译对象为已发生的滑坡泥石流灾害,不包括未发生的灾害隐患点的识别,解译的滑坡包含崩塌。②保证准确,灾害发生后没入水下的,通过影像无法判断的滑坡泥石流灾害体不作识别。③力求完整,单个大型滑坡整体作为勾绘单元,周边浅表层崩塌体不作为其组成部分;群发性且连片分布的滑坡或崩塌作为整体解译。
在实际操作中,利用地质灾害专家知识,建立滑坡泥石流影像解译标志,并采用目视解译方式,结合全省三维模型数据对滑坡泥石流灾害体进行解译,采用ArcGIS软件完成灾害体边界的勾绘,生成矢量面状数据。将矢量面状数据转换成仅含0和1的二值栅格图像数据(1标注为滑坡,0为其他地物)。边界勾绘要力求灾害体完整和精准,主要解译标志如下:
(1)滑坡(含崩塌)解译特征。滑坡体与周围环境在形态、色调、纹理、植被发育及生长状况上有明显的差异。主要表现在:滑坡灾害通常呈簸箕形或舌形的平面形态,部分可见滑坡壁、流通区刮铲痕迹和舌状堆积区等地貌特征。滑坡的后壁陡峻并呈围椅状,形态常呈弧形或折线形,崩塌的后壁受岩体结构面控制,常表现为陡直的破碎岩壁。滑坡色调呈高亮度显示,与周边绿色植被明显区分,其纹理较路面和建筑地表粗糙。滑坡体上的树木有明显的倾斜或倾倒。数据集还根据灾害事件信息区分了地震滑坡和降雨滑坡。
(2)泥石流解译特征。典型的泥石流流域可划分为物源区、流通区与堆积区,本文主要以堆积区特征进行解译。根据沟口的地貌特征,即发现沟口有明显的堆积扇,则判别其为泥石流沟,堆积扇轮廓明显,质感细腻且色调较浅,扇面无固定沟槽,多呈漫流状态。根据泥石流流域形态,进一步划分为沟谷泥石流与坡面泥石流。其中,沟道泥石流流域呈扇形或狭长条形,物源区范围大,部分有支沟,有明显流通区,沟谷长且两侧陡峭,一次冲出规模较大;坡面泥石流流域呈斗状或扇形,物源区面积小,无支沟,无明显流通区,沟短坡陡,规模较小。
1.3   影像和解译标注数据集制作
按滑坡泥石流灾害体完整性原则,对每处灾害体影像数据及其对应的解译标注数据按照标准矩形进行裁剪,生成一对大小相等、位置一致的影像和解译标注数据,依次完成共107处滑坡泥石流灾害数据集制作,最后根据收集的滑坡泥石流灾害事件信息,制作数据集描述文档。
数据集数据组织方式安排如下(图2):


图2   滑坡泥石流灾害航空影像数据集组织形式
(1)存储形式:按照滑坡和泥石流两类分类存储,每类灾害包括三个部分文件,即:正射影像图片数据、解译标注图片数据和描述文档。
(2)图片尺寸及格式:正射影像图片数据按照300dpi存储,图片大小根据灾害体范围调整,解译标注数据集范围和分辨率与正射影像图片保持一致,两者均采用TIF格式存储,如:Landslides001、LandslidesLabel001;Derisflow001、DerisflowLabel001。描述文档按照<acquired time>、<ground resolution >、<disaster name >、<disaster time>、<disaster location>、<disaster type>、<disaster area>、<disaster magnitude>统一的命名规则,即对应的影像获取时间、影像地面分辨率、灾害名称、灾害时间、位置(纬度、经度)、灾害类型、灾害面积、灾害规模,采用TXT文件存储。
(3)目标物体的定义:正射影像图片外边界应包含灾害体全部及其周边小部分地物(如:植被、房屋、道路、河流等),且灾害体与周边环境在色彩、纹理、形状等方面有明显差异;解译标注图片为二值化栅格数据,删数据值为1表示滑坡或泥石流,0则表示其他地物。
2   数据样本描述
选取了具有典型代表意义的数据样本对本数据集作例证说明(图3)。具体如下:
(1)沟谷泥石流。共31处样本,选取2010年“8.13”文家沟泥石流作为典型样本(图3a,b),影像获取时间为2010年8月15日,地面分辨率为0.4 m,灾害位置为31.549°N、 104.112°E,堆积区面积70万 m2,灾害规模为430万m3。范围包含了泥石流堆积区和主要流通区。
(2)坡面泥石流。共17处样本,选取2013年“7·10”G213线(汶川县境内)坡面泥石流作为典型样本(图3c,d),影像获取时间为2013年7月20日,地面分辨率为0.6 m,灾害位置为31.219°N、103.486°E,堆积区面积8.4万 m2,无灾害规模记录。
(3)地震滑坡。共36处样本,选取2008年“5·12”汶川地震唐家山滑坡作为典型样本(图3e,f),影像获取时间为2008年5月16日,地面分辨率为0.9 m,灾害位置为31.843°N、104.433°E,滑坡体面积89.7万 m2,灾害规模为2037万m3
(4)降雨滑坡。共23处样本,选取2018年“10·11”金沙江白格滑坡作为典型样本(图3g,h),影像获取时间为2008年10月12日,地面分辨率为0.2 m,灾害位置为31.082°N、98.706°E,滑坡体面积149.8万 m2,灾害规模为850万m3
图3   滑坡泥石流灾害航空影像数据集样本

a. 2010年“8.13”文家沟泥石流影像

b. 2010年“8.13”文家沟泥石流解译标注

c. 2013年“7·10”G213线坡面泥石流影像

d.2013年“7·10” G213线坡面泥石流解译标注

e. 2008年“5·12”唐家山滑坡影像

f. 2008年“5·12”唐家山滑坡解译标注

g. 2018年“10.11”金沙江白格滑坡影像

h. 2018年“10.11”金沙江白格滑坡解译标注
3   数据质量控制和评估
本数据集数据来源明确,数据处理过程和结果精确,解译标注准确可信,灾害信息详实,实现了各环节数据质量控制。
(1)本数据集采用的航空影像数据源明确(获取时间、分辨率等指标明确),均为测绘权威部门在历年灾害事件发后第一时间获取的影像数据,影像数据处理严格按照航空正射影像生产流程,部分数据通过了权威机构(四川省测绘产品质量监督检验站)质量检验。
(2)滑坡泥石流灾害目视解译过程,均有地质灾害相关领域专家指导或参与,保证解译标注数据的专业和准确性。每个灾害样本均有对应的灾害信息可查,保证数据集的完备性。
4   数据价值
与国内外现有的相关数据集相比,本数据集在数据源质量、数据集完备性和潜在应用等方面都更具价值。
(1)数据源精度高且覆盖时间长,数据精度达0.2~0.9 m,时间为2008~2020年,涵盖了四川省及周边典型的滑坡泥石流灾害事件。前人相关成果多利用较低分辨率(差于1 m)的卫星影像解译获取,且卫星影像质量受天气、地形等影响较大。
(2)数据集完备,包含了影像图片数据、解译标注数据和文本描述数据,而前人的相关成果多为灾害历史编目,仅以矢量点或面文件保存,缺少对应的影像图片。
(3)潜在应用领域广泛,本数据集不仅可用于滑坡泥石流灾害的自动化解译,还可用于灾害分布规律、风险分析等研究工作。
致 谢
感谢四川测绘地理信息局提供数据支持。
[1]
许冲, 戴福初, 陈剑, 等. 汶川Ms8.0地震重灾区次生地质灾害遥感精细解译[J]. 遥感学报, 2009, 13(004):745-762.
[2]
董秀军, 许强, 佘金星, 等. 九寨沟核心景区多源遥感数据地质灾害解译初探[J]. 武汉大学学报·信息科学版, 2020, 45(3): 432-441.
[3]
Lei T, Zhang Y, Lv Z, et al. Landslide inventory mapping from bitemporal images using deep convolutional neural networks[J]. IEEE Geoscience and Remote Sensing Letters. 2019,16(6):982-6.
[4]
Ghorbanzadeh O, Blaschke T, Gholamnia K, et al. Evaluation of different machine learning methods and deep-learning convolutional neural networks for landslide detection[J]. Remote Sensing. 2019,11(2):196.
[5]
Guzzetti, F., Cardinali, M. Reichenbach, P. The AVI project: A bibliographical and archive inventory of landslides and floods in Italy[J]. Environmental Management,1994,18, 623–633.
[6]
钟敦伦, 王成华, 谢洪,等. 中国泥石流滑坡编目数据库与区域规律研究[M]. 成都:四川科学技术出版社, 1998.
数据引用格式
曾超, 曹振宇, 苏凤环, 等. 四川及周边滑坡泥石流灾害高精度航空影像及解译数据集DB/OL]. SDB, 2021. (2021-02-08). DOI: 10.11922/sciencedb.j00001.00222.
稿件与作者信息
论文引用格式
曾超, 曹振宇, 苏凤环, 等. 四川及周边滑坡泥石流灾害高精度航空影像及解译数据集[J/OL]. 中国科学数据, 2021. (2021-02-08). DOI:10.11922/noda.2021.0005.zh.
曾超
ZENG Chao
主要承担工作:数据集总体设计,负责滑坡泥石流灾害解译,影像及解译样本数据集制作。
zeng3chao@163.com
(1986—),男,四川省成都市人,博士研究生,高级工程师,山地灾害遥感与风险评估、自然资源调查监测。
曹振宇
Cao Zhenyu
主要承担工作:负责影像数据集质量控制。
(1978—),男,四川省成都市人,博士研究生,正高,地理信息系统与遥感。
苏凤环
Su Fenghuan
主要承担工作:负责滑坡泥石流灾害解译,数据集质量控制。
(1977—),女,四川省成都市人,博士研究生,副研究员,灾害遥感与风险评估。
曾珍
Zeng Zhen
主要承担工作:负责滑坡泥石流灾害解译及解译数据集制作。
(1988—),女,四川省成都市人,硕士研究生,工程师,灾害遥感。
余长锡
Yu Changxi
主要承担工作:负责滑坡泥石流灾害数据收集与处理。
(1986—),男,四川省成都市人,硕士研究生,高级工程师,地理信息系统。
出版历史
I区发布时间:2021年2月8日 ( 版本ZH3
参考文献列表中查看
中国科学数据
csdata