其他数据论文 I 区论文(评审中) 版本 ZH2
下载
2001–2019年中国暴雨数据集
A rainstorm dataset in China during 2001–2019
 >>
: 2021 - 08 - 24
: 2021 - 09 - 23
: 2021 - 09 - 23
1414 24 0
摘要&关键词
摘要:本数据集是基于全球降雨测量(Global Precipitation Measurement, GPM)数据提取的2001年1月至2019年12月长时间序列暴雨数据集,根据中国气象局对暴雨定义确定提取暴雨阈值,运用基于Python语言开发的暴雨识别工具提取暴雨信息,并整理为覆盖中国地区暴雨数据集,空间分辨率为0.1°×0.1°。本数据集基于长时间序列、高精度、高分辨率卫星降水产品研制,能够全面反映全国范围内极端降雨时空分布特点以及变化特征。本数据集可用于暴雨时空特征的预测、防灾减灾、为社会经济以及生态环境的发展提供助力,具有重要的理论与实际应用价值。
关键词:暴雨;GPM;中国
Abstract & Keywords
Abstract: This rainstorm dataset is extracted from a long time series (January 2001 to December 2019) of the Global Precipitation Measurement (GPM) product. According to the rainstorm threshold defined by the China Meteorological Administration, rainstorm events are extracted from time series GPM data using Python programming. The dataset covers the whole China with a spatial resolution of 0.1°×0.1°. Derived from long-term sequence of satellite precipitation products, with high-precision and high-resolution, this rainstorm dataset can reflect the spatial distribution characteristics of extreme precipitation in China. Understanding the temporal and spatial characteristics of rainstorms across the country can help prevent and alleviate disasters. This dataset provides important support for the development of the social economy and ecological environment. It is of important theoretical and practical application value.
Keywords: rainstorm; Global Precipitation Measurement (GPM); China
数据库(集)基本信息简介
数据集(库)名称2001–2019年中国暴雨数据集
数据作者柏荷,明義森,刘启航,黄昌
数据通讯作者黄昌(changh@nwu.edu.cn)
数据时间范围2001 – 2019年
地理区域地理范围为73°33′–135°05′E,3°51′–53°33′N。地理区域范围为中国。
空间分辨率0.1°×0.1°
数据量16.2 MB
数据格式*.tif
基金项目国家重点研发计划项目(2017YFC1502501)
数据系统服务网址http://www.doi.org/10.11922/sciencedb.j00001.00290
数据集(库)组成本数据集包括2001–2019年中国范围内暴雨数据。按照不同年份,每一年的暴雨数据单独存储在一个文件夹中,共计19个文件。文件夹中包括StormCount(暴雨次数)、StormDuration(暴雨持续时间)、StormLevel(暴雨等级)、StormPeak(暴雨峰值雨量)、StormTime(暴雨发生时间)、StormVolume(暴雨雨量)6个数据。经压缩后,本数据集的数据量大约为16.2 MB。
Dataset Profile
TitleA rainstorm dataset in China during 2001–2019
Data authorBai He, Ming Yisen, Liu Qihang, Huang Chang
Data corresponding authorHuang Chang (changh@nwu.edu.cn)
Time rangs2001–2019
Geographical scopeLongitude&latitude; geographical scope (73°33′-135°05′E,3°51′-53°33′N); specific areas include: China
Spatial resolution0.1°×0.1°
Data volume16.2 MB
Data format*.tif
Source of fundingNational Key R & D Program (2017YFC1502501).
Data service system<http://www.doi.org/10.11922/sciencedb.j00001.00290>
Dataset compositionThis dataset includes rainstorm data in China from 2001 to 2019. According to different years, the rainstorm data for each year is stored in a separate folder, a total of 19 files. which includes 6 sub-datasets, StormCount, StormDuration, StormLevel, StormPeak, StormTime, and StormVolume. After compression, the data volume of this dataset is approximately 16.2 MB.
引 言
近几十年来,随着全球气候变暖加速了水循环,极端降水、干旱等极端天气事件频繁发生,使得洪涝、干旱、崩塌、滑坡、泥石流等灾害事件发生次数也随之增加。极端降水具有突发性和复杂的时空分布特征,不仅对人类生命财产安全产生威胁,而且对生态环境和社会经济发展造成了巨大的危害,因此极端降水的时空变化规律等成为各国学者关注和研究的重点[1,2,3]
中国地处亚欧大陆东部,太平洋西岸,幅员辽阔,地势西高东低且地形复杂,气候类型多样,大陆性季风气候显著。中国因其独特的气候特征和复杂的地形,造成水旱等自然灾害频繁发生[4]。获取高精度、高时空分辨率且长时间连续极端降水观测资料是我们全面认知不同气候区内极端降水变化趋势的重要手段。然而由于传统气象观测雨量站观测站点空间分布不均等因素,使得高空间分辨率的降水数据资料匮乏,在研究降水方面数据受到限制。随着卫星技术的发展,遥感反演降水为获取降水资料提供了一种新途径。卫星遥感数据具有不受天气和复杂地形影响、陆地海洋全覆盖、大面积、全天候观测等特点,因而成为获取降水时空变化信息的重要方式[5]。本文基于长时间序列全球降雨测量(Global Precipitation Measurement, GPM)研制了2001–2019年中国逐日的空间分辨率为0.1°×0.1°的暴雨数据集,来揭示中国暴雨的时空变化特征。本数据集克服了气象观测雨量站观测站点空间分布不均匀、难以连续反映降水的空间分布等缺点,利于分析全国范围内暴雨的时空变化特征。
1 数据采集和处理方法
1.1 数据来源
本文采用的GPM数据来自美国国家航空航天局(NASA)网站(https://www.nasa.gov/),气象站点观测数据来自于国家气象信息中心(http://data.cma.cn)。GPM采用逐日的空间分辨率为0.1°×0.1° IMERG(Integrated Multi-satellitE Retrievals for GPM)产品数据集(IMERG_final),为了保证研究周期内数据完整性,本数据集选取的时间范围为2001年1月至2019年12月。
GPM卫星计划是由美国宇航局(NASA)执行,日本宇宙航空开发机构(The Japanese Aerospace Exploration Agency, JAXA)以及欧盟等其他一些国际组织合作建设的主要用于气象预报的卫星监测系统,目的在于提高测量精度和采样频率,实现更准确的、更早的气象预报。GPM卫星数据与传统的热带降雨测量任务(Tropical Rainfall Measuring Mission, TRMM)卫星数据相比,提高了对弱降水(<0.5 mm/h)和固态降水的探测能力,更大程度上提高其时空分辨率、观测精度和准确性,真正实现了全球降水(含雨雪)产品的功能[6-7]
1.2 数据处理方法
本数据集采用的数据均来自GPM数据来自美国国家航空航天局(NASA)网站,数据的下载、格式转换、裁剪等基本处理完成后,运用Python开发的暴雨识别工具,识别每个网格内的暴雨。暴雨识别工具可以自动化从网格时间序列的降水数据中识别每个网格内发生的暴雨事件。运用暴雨识别工具提取出数据库,用来记录每个网格所对应的降雨量峰值、降雨量峰值时间、降雨量持续时间和强度。再根据该数据库进行暴雨数据集的提取。在本数据集中以StormCount、StormDuration、StormLevel、StormPeak、StormTime、StormVolume呈现。
根据中国气象局对暴雨的定义,24小时内降水量大于50 mm为暴雨(http://www.cma.gov.cn/)。暴雨识别的核心算法是根据暴雨的定义来提取每个网格24小时内发生暴雨时,StormDuration(暴雨持续时间)、StormLevel(暴雨等级)、StormPeak(暴雨峰值雨量)、StormTime(暴雨发生时间)和StormVolume(暴雨雨量)5个变量,其中StormLevel为StormPeak / StormTime。根据暴雨的定义以及GPM时间分辨率设置时间间隔(TR)为24h,检验覆盖研究区域的Ni=1,2,3,…,N)个网格(G)中,每个网格从开始到结束的时间内(t=1,2,3,…,n)是否有暴雨事发生,将暴雨事件中,StormDuration、StormLevel、StormPeak、StormTime和StormVolume 5个变量的初始值设为0,每一个网格从初始时间到结束时间的降雨量设为Git,通过比较i=1, t=1时Git与StormPeak(SP)的大小来确定暴雨事件是否发生。当Git > SP 时,说明Git为此刻的暴雨峰值雨量,其他四个相关变量也随之更新;当0< SP <Git 时,说明该网格此刻正发生暴雨,将StormVolume和StormDuration的数值更新并整合到当前的暴雨事件中;当Git = 0时,说明该网格的降雨事件已经结束。然后将这些变量重新初始化以找到另一个暴雨事件,对每个网格重复上述操作,直到t = n为止。通过比较SP与预先的暴雨阈值(Th)进行比较,来识别暴雨事件的发生。所有暴雨事件中的变量都存储在一个数据库表格中。该表格记录了每个发生暴雨事件网格的位置及其相关变量,利用这些信息来绘制暴雨图。
2 数据样本描述
本数据集为中国0.1°×0.1°分辨率的24小时暴雨栅格数据集。时间范围为2001年1月至2019年12月。数据集压缩后文件共计16.2 MB,按照年份不同分别存储在19个文件夹中,数据存储格式为GeoTIFF(.tif)栅格数据格式。数据集文件命名规则为:StormCount +年份.tif;StormDuration +年份.tif;StormLevel +年份.tif;StormPeak +年份.tif;StormTime +年份.tif;StormVolume +年份.tif。文件名含义见表1。图1为2019年暴雨数据集文件示例。
表 1   文件名含义
文件名中文含义单位
StormCount暴雨次数:一年内暴雨发生的次数
StormDuration暴雨持续时间:暴雨发生时,暴雨持续的时间小时(h)
StormLevel暴雨等级:暴雨量与暴雨持续时间的比值毫米/小时(mm/h)
StormPeak暴雨峰值雨量:暴雨量最高值毫米/小时(mm/h)
StormTime暴雨发生时间:暴雨发生在一年中的第几天天(doy, day of year)
StormVolume暴雨量毫米(mm)


图1   2019年暴雨数据集文件示例
(a)暴雨次数;(b)暴雨持续时间(h);(c)暴雨等级(mm/h);(d)暴雨峰值雨量(mm/h);(e)暴雨量(mm)。(图片送审中)
3 数据质量控制和评估
3.1 质量控制
为了保证暴雨数据集的精度并且能够进一步实现数据集的有效共享,本文采用GPM卫星降水数据产品进行暴雨数据集的研制。近年来,国内外众多学者对卫星降水产品的精度进行了评估,并且已经有研究主要针对GPM卫星降水数据产品在中国区域内的适用性进行了精度验证并给予了积极肯定的态度。如张茹等采用6种评价卫星降水数据的统计指标,结合误差分解的方法评估了GPM卫星降水产品在大陆地区的降水反演精度,证明GPM卫星降水产品能够较好地反映中国大陆地区的降水情况[8];Chen等收集了2015年到2018年间包括GPM在内的三种高分辨率卫星降水产品,并用雨量计观测数据分析和评估卫星降水产品在中国区域内的时空精度特征等,得到高分辨的卫星降水产品能够更精确的表达降水的空间特征,并且GPM能够更好的表达暴雨事件[9]。IMERG是通过GPM卫星群获取微波、红外和雷达数据大量遥感信息,反演生成的降水卫星数据集,能够实现多源传感器之间优势互补[10-11]。IMERG作为GPM的代表产品,具有空间分辨率0.1°ⅹ0.1°、时间分辨率0.5h并且覆盖区域达到了60°N~60°S的特点。IMERG根据源数据处理过程不同,向用户提供了包括近实时Early-Run(Early)、Late-Run(Late)和滞时Final-Run(Final) 3种产品。其中IMERG_Final 产品包括纯卫星融合数据集(IMERG_Uncal)和通过全球降水气候中心(the Clobal Precipitation Climatology Centre, GPCC)站点资料进行校正后的数据集(IMERG_Cal)[10,12],近年来,众多国内外相关学者研究表明IMERG_final产品精度有显著的提升,其精度最接近实际降水数据,在水文模拟和气候变化等研究方面具有重要意义[11,13,14,15]
3.2 质量评估
为了验证利用GPM卫星降水数据产品生产的暴雨数据集的可靠性,使用中国区域内气象观测站点2001年1月至2019年12月的日降水量观测数据作为参考对其进行验证。
根据暴雨的定义,使用暴雨量阈值对GPM卫星降水产品和气象站点观测数据进行暴雨的提取,将两种数据提取的到的暴雨信息进行比较,本文中利用GPM与站点观测数据提取到的暴雨次数差值以及暴雨量差值进行本数据集的质量评估。在2001年1月至2019年12月之间,如图2中的(a)和(b)所示,从整体上来看GPM高估了中国区域内暴雨发生的次数和暴雨量,在中国东南部地区较为显著。从图 2(a)中可以看出,在2001年至2019年间,GPM提取的暴雨次数比气象观测站点数据提取的暴雨次数差值最多的为几十次,但是在中国西部以及北部地区GPM数据表现良好,在中国西部地区尤为明显。在图 2(b)中,GPM提取到的暴雨量普遍比气象站点观测数据提取的暴雨量高,在中国新疆和西藏地区GPM暴雨量值表现良好。从整体看,GPM数据总体普遍高估了暴雨量,亲高估区域无明显空间模式。


图2   GPM卫星降水数据与降水量观测数据对比图
(a)暴雨发生次数差;(b)暴雨量差(图片送审中)
4 数据价值
中国是暴雨事件发生比较频繁的国家之一,近年来极端降水事件频发,严重人类的人身安全和财产安全以及生态环境。本数据集具有高空间分辨率、精度高、时间序列长,能提供整个研究区域的暴雨信息等特点,一定程度上弥补了传统气象观测雨量站观测站点空间分布不均匀造成的降雨数据缺失,能够帮助我们了解全国范围内暴雨的时空变化动态特征,并且为研究全国近十几年来的暴雨提供有价值的数据源。该数据集可用于暴雨时空特征的预测防灾减灾,为社会经济以及生态环境的发展提供助力,具有重要的理论与实际应用价值。
[1]
严志涛, 李谢辉, 刘子堂, 等. 气候变暖背景下西南四省市暴雨洪涝灾害风险变化[J]. 灾害学, 2021, 36: 200–207.
[2]
卢芹芹, 秦年秀, 汪军能, 等. 近60年来百色地区极端降水事件的时空节律变化特征[J]. 水土保持研究, 2021, 28(3): 216–222, 2. DOI:10.13869/j.cnki.rswc.2021.03.025.
[3]
高文德, 王昱, 李宗省, 等. 高寒内流区极端降水的气候变化特征分析[J/OL]. 冰川冻土: 1-11[2021-08-24].
[4]
MIAO Y, WANG A H. A daily 0.25° × 0.25° hydrologically based land surface flux dataset for conterminous China, 1961-2017[J]. Journal of Hydrology, 2020, 590: 125413. DOI:10.1016/j.jhydrol.2020.125413.
[5]
肖柳斯, 张阿思, 闵超, 等. GPM卫星降水产品在台风极端降水过程的误差评估[J]. 高原气象, 2019, 38(5): 993–1003. DOI:10.7522/j.issn.1000-0534.2018.00143.
[6]
唐国强, 万玮, 曾子悦, 等. 全球降水测量(GPM)计划及其最新进展综述[J]. 遥感技术与应用, 2015, 30(4): 607–615. DOI:10.11873/j.issn.1004-0323.2015.4.0607.
[7]
陈家琳, 雍斌. GPM-GSMaP卫星降水在中国大陆的误差解析[J]. 亚热带资源与环境学报, 2020, 15(4): 76–85. DOI:10.19687/j.cnki.1673-7105.2020.04.010.
[8]
张茹, 雍斌, 曾岁康. GPM卫星降水产品在中国大陆的精度评估[J]. 人民长江, 2021, 52(5): 50–59. DOI:10.16232/j.cnki.1001-4179.2021.05.009.
[9]
YU C, HU D Y, LIU M Q, et al. Spatio-temporal accuracy evaluation of three high-resolution satellite precipitation products in China area[J]. Atmospheric Research, 2020, 241: 104952. DOI:10.1016/j.atmosres.2020.104952.
[10]
卫林勇, 江善虎, 任立良, 等. IMERG卫星降水产品在中国的干旱监测效用评估[J]. 农业工程学报, 2021, 37: 161–169.
[11]
HUFFMAN GJ, BOLVIN DT, NELKIN EJ. Integrated Multi-satellitE Retrieval for GPM(IMERG) technical documentation. NASA, 2008.
[12]
唐国强, 龙笛, 万玮, 等. 全球水遥感技术及其应用研究的综述与展望[J]. 中国科学: 技术科学, 2015, 45: 1013–1023.
[13]
任英杰, 雍斌, 鹿德凯, 等. 全球降水计划多卫星降水联合反演IMERG卫星降水产品在中国大陆地区的多尺度精度评估[J]. 湖泊科学, 2019, 31: 560–572.
[14]
石琳, 杨春生, 卫林勇, 等. IMERG卫星降水产品实时监测黄河流域干旱效用分析[J]. 水电能源科学, 2021, 39: 9–11, 24.
[15]
曾岁康, 雍斌. 全球降水计划IMERG和GSMaP反演降水在四川地区的精度评估[J]. 地理学报, 2019, 74: 1305–1318.
数据引用格式
柏荷, 明義森, 刘启航, 等. 2001–2019年中国暴雨数据集[DB/OL]. SDB, 2021. (2021-09-22). DOI: 10.11922/sciencedb.j00001.00290.
稿件与作者信息
论文引用格式
柏荷, 明義森, 刘启航, 等. 2001–2019年中国暴雨数据集[J/OL]. 中国科学数据, 2021. (2021-08-24). DOI: 10.11922/11-6035.csd.2021.0050.zh.
柏荷
Bai He
主要承担工作:研究思路与方案设计、数据集研制、精度验证、共享服务、论文撰写。
(1996—),女,黑龙江省哈尔滨人,硕士研究生,研究方向为遥感和GIS应用。
明義森
Ming Yisen
主要承担工作:数据可视化、算法修改。
(1997—),男,湖北省十堰人,硕士研究生,研究方向为遥感和GIS应用。
刘启航
Liu Qihang
主要承担工作:算法修改。
(1997—),男,陕西西安人,博士研究生,研究方向为遥感和GIS应用。
黄昌
Huang Chang
主要承担工作:算法研究,数据集产品评估。
changh@nwu.edu.cn
(1986—),男,江西宜春人,博士,副教授,研究方向为遥感和GIS应用。
出版历史
I区发布时间:2021年9月23日 ( 版本ZH2
参考文献列表中查看
中国科学数据
csdata