数据论文 I 区论文(评审中) 版本 ZH1
下载
2010年中国工业产值公里格网数据集
1 km grid dataset of industrial output value in China (2010)
 >>
: 2017 - 09 - 20
: 2017 - 10 - 16
1174 4 0
摘要&关键词
摘要:空间化工业产值数据的缺乏,使得全球变化背景下工业经济系统风险与灾害评估等工作受到很大限制。我们发展了一套融合美国国防气象卫星计划/线性扫描业务系统(DMSP/OLS,Defense meteorological satellite program/operational linescan system)夜间灯光数据、中分辨率成像光谱仪(MODIS,Moderate resolution imaging spectroradiometer)全年植被数据集、工业用地空间分布数据的工业产值数据空间化方法,形成了2010年中国工业产值公里格网数据集。本数据集的主要构建步骤为:(1)数据预处理与稳定灯光数据选取;(2)利用MODIS植被指数消除夜间灯光数据饱和与溢出现象,构建基于增强型植被指数的夜间灯光调整指数(EANTLI,Enhanced vegetation index adjusted nighttime light index);(3)利用工业用地空间分布数据对EANTLI指数进行修正,得到工业用地最佳灯光指数;(4)构建工业产值空间分配模型;(5)数据质量精度验证,全国90个城市的随机样本验证结果表明,空间化工业产值数据的相对误差在0%~39.6%之间,且大部分样本的相对误差小于15%,数据集平均精度为80.32%。
关键词:工业产值;中国;DMSP/OLS;空间化
Abstract & Keywords
Abstract: The lack of spatial industrial output value data limited the risk and disaster assessment of industrial economy responding to global change. Therefore, we developed a new method to spatialize industrial output value coupling DMSP/OLS (Defense meteorological satellite program/operational linescan system) nighttime light data, MODIS (Moderate-resolution imaging spectroradiometer) annual vegetation data and industrial land distribution data. A grid data set of 1 km industrial output value of China was created using this method. The main steps creating the data set were as follows: (1) data preprocessing and selecting stable lighting data; (2) constructing an Enhanced Vegetation Index (EVI) adjusted nighttime light index (EANTLI) using nighttime light data which eliminated saturation and overflow by virtue of MODIS Vegetation Index; (3) obtaining optimum light index with EANTLI index which has been modified by industrial land distribution data; (4) constructing spatial distribution model of industrial output value; (5) verifying data accuracy. We randomly selected 90 cities nationwide to assess the accuracy of the data set. The results show that the relative errors of whole samples ranged from 0% to 39.6%,the relative errors of most samples were less than 15%, and the average accuracy of the data set was as high as 80.32%.
Keywords: industrial output value;  China;  DMSP/OLS; spatialization
数据库(集)基本信息简介
数据库(集)中文名称
English title
2010年中国工业产值公里格网数据集
1 km industrial output value grid data set of China (2010)
数据作者
Data authors
薛倩、宋伟、朱会义
Xue Qian, Song Wei, Zhu Huiyi
通讯作者
Corresponding author
宋伟 (songw@igsnrr.ac.cn)
Song Wei (songw@igsnrr.ac.cn)
数据时间范围
Time range
2010年
2010
地理区域
Geographical scope
中国大陆地区
China’s mainland
空间分辨率
Spatial resolution
1000 m
数据量
Data volume
15.1 MB
数据格式
Data format
*.tif ,*.shp, *.mxd, *.xlsx
数据服务系统网址
Data service system
http://www.sciencedb.cn/dataSet/handle/497
基金项目
Sources of funding
国家重点研发计划,全球变化人口与经济系统风险形成机制及评估研究(2016YFA0602400)
National Key Research and Development Program – Global Change and Mitigation Project: Global change risk of population and economic system mechanism and assessment (2016YFA0602400)
数据库(集)组成
Dataset composition
数据集由3部分数据组成,其中:
1. 2010年中国工业产值公里格网数据集.gdb.zip是包含行政边界信息以及栅格格式的中国2010年每公里工业产值数据(14.2 MB)
2.精度验证.xls是全国90个城市工业产值统计数据和验证精度说明(23 KB)
3. 2010年中国工业产值公里格网数据集.mxd是可编写的ArcGIS数据文件(850 KB)
The dataset is composed of three subsets.
(1) 1 km industrial output value grid data set of China(2010).gab.zip includes administrative border data and spatial distribution data of industrial output value of mainland China in 2010. The format of the spatial distribution data is 1 km grid with a data volume of 14.2 MB.
(2) Accuracy verification.xls is an accuracy file including the randomly selected 90 sample Chinese cities for accuracy assessment and their statistical industrial output value, spatialized value and assessed accuracy. The data volume is 23 KB.
(3) 1 km industrial output value grid data set of China(2010). mxd is a programmable ArcGIS data file, with a data volume of 850 KB.
引 言
辨析气候变化下的社会经济系统风险是目前气候变化研究的重点内容之一[1]。就工业系统而言,气候变化一方面通过均值波动间接对工业行业的原料存储、加工以及运输过程产生影响[2],另一方面通过极端气候事件对工业生产的各个环节及工作人员产生破坏性的影响(例如工厂基础设施破坏、人员伤亡等)[3-4]。准确评估气候变化带来的工业经济系统风险与损失,依赖于较高精度的工业经济系统暴露分析[5],工业产值的空间分布制图则是工业经济系统暴露分析的重要基础数据之一。
近年来,国内外在国内生产总值(GDP,Gross domestic product)空间分布制图方面已经取得了比较多的进展[6]。但是,由于常规的遥感手段很难在空间上实现第二、三产业产值的准确识别,全球以及中国工业产值格网数据仍然相对缺乏。目前,已有的一些工业经济系统产值数据空间化制图,多为省、市、县级尺度[7],且空间分辨率多以行政区为最小单元,无法表征省或者城市内部工业产值的差异及空间分布,在风险评估中很难与气候格网数据等开展叠加分析。基于此,也有一些针对工业某一具体行业产值的空间化研究数据[8-9],但是总体上缺少大尺度(中国)、高分辨率、综合性的工业产值空间化数据。所以,本数据集结合美国国防气象卫星计划/线性扫描业务系统(DMSP/OLS,Defense meteorological satellite program/operational linescan system)夜间灯光数据、中国各省工业产值统计数据以及中分辨率成像光谱仪(MODIS,Moderate resolution imaging spectroradiometer)中的植被指数产品,对中国2010年工业产值进行遥感反演,并利用工业用地空间分布数据对其进行修正,形成中国1 km分辨率的工业产值格网数据集。本数据集可以为全球变化中工业经济系统的风险与灾害评估等提供基础数据支撑。
1   数据采集和处理方法
本数据集构建过程包括数据收集、夜间灯光数据和植被指数数据预处理、构建基于增强型植被指数的夜间灯光调整指数(EANTLI,Enhanced vegetation index adjusted nighttime light index)及利用工业用地空间分布数据进行灯光修正、构建分配模型、数据质量精度验证几个步骤(图1)。


图1   数据集构建及处理流程
1.1   数据来源
本数据集对工业的定义以世界银行数据统计标准为主,包含采矿、制造、建筑、电力、水和天然气生产和供应业,与中国统计局差别在于将建筑业纳入了工业,所以,本数据集中所采用的2010年全国各省份工业产值和市级工业产值数据为工业产值和建筑业产值之和,数据均来自于国家统计局发布的《中国统计年鉴》和各省统计年鉴(http://www.stats.gov.cn/tjsj/ndsj/)。
夜间灯光数据选取美国气象卫星DMSP/OLS成像得到的非辐射定标夜间平均灯光产品。其优势在于能通过灯光强度变化反应地理实体信息,特别地,该产品中的稳定灯光数据通常被用于提取城市区域[10-11]、反演社会经济数据[12-13]等研究中。本数据集所选取的夜间灯光数据为稳定灯光数据(https://ngdc.noaa.gov),其空间分辨率为1 km,像元灰度值(DN,Digital number)范围为0~63,数据时间为2010年。由于DMSP/OLS数据存在的饱和与溢出现象会削弱灯光数据和社会经济数据的相关性[14],并影响反演精度。而且有研究表明,植被指数和灯光强度值变化存在较好相关关系[15],因此可以通过植被指数来消除夜间灯光数据的饱和与溢出现象对社会经济数据反演的影响。所以本数据集选取空间分辨率为1 km的MODIS月合成植被指数产品(MOD13A3)中的增强型植被指数(EVI,Enhanced vegetation index)(http://ladsweb.nascom.nasa.gov/data)对灯光饱和与溢出现象进行预处理。
同时,选取数据中国科学院资源环境科学数据中心2010年工业用地空间分布数据(http://www.resdc.cn)对EANTLI指数进行精度修正。
1.2   数据处理
利用夜间灯光数据与植被指数之间关系消除灯光数据饱和与溢出现象,并构建最佳灯光指数,同时利用工业用地空间分布数据对其进行修正得到工业用地上的最佳灯光数据并与工业产值数据构建分配模型,得到工业产值公里格网数据集。具体流程如下:
(1)对夜间灯光数据进行预处理,包括按行政边界剪裁、二值化、归一化等,提取灯光强度值,并计算归一化的灯光强度值;
(2)对MODIS植被指数数据进行处理,首先从MOD3产品中提取出中国2010年1-12月的EVI,并进行初步的剪裁、镶嵌、投影等工作;
(3)EVI数据处理,计算EVI的均值,为去除月份不同对夜光数据造成的敏感性,所以本数据集选取EVI全年12个月的均值数据,并剔除EVI小于0.01的区域,此区域包括水体、裸岩等无人区域;
(4)构建EANTLI指数。通过公式(1)[14],构建最佳灯光指数。其中EANTLI为最佳灯光指数,NTLn 为归一化灯光强度,EVIi 指处理过后的EVI数据,NTL为原始灯光强度。EANTLI能够较大程度上削减灯光饱和与溢出现象,以凸显城市内部灯光强度差异,更好地对经济数据进行反演。
\[EANTLI=\left ( \frac{2}{1-NTL_{n}+EVI_{i}} \right )\times NTL\]
(1)
(5)通过工业用地空间分布数据对第4步得到的EANTLI指数结果进行修正,得到工业用地最佳灯光指数。
(6)利用国家统计局《中国统计年鉴》[16]中计算得到的全国各省2010年工业产值数据与工业用地最佳灯光指数进行回归分析,构建分配模型,初步得到工业产值公里格网数据。
(7)利用市级统计年鉴计算得到的各城市工业产值数据进行精度验证,满足则得到最终2010年中国工业产值公里格网数据集,否则重新构建分配模型。
2   数据样本描述
经过数据处理,得到2010年中国工业产值公里格网数据集。本数据集可以比较清晰地反映每公里工业产值的空间分布特征。由于地理位置及政策优势,我国工业产值的高值区域主要分布在我国沿海区域,特别是长三角、珠三角、环渤海等几个典型地区(图2);而西北地区由于地处内陆,交通运输条件较差,工业产值普遍较低,且呈点状零星分布,且相较于沿海区域数值明显较低。


图2   2010年中国工业产值公里格网数据
3   数据质量控制和评估
数据验证时,首先开展了最佳灯光数据与工业产值的相关性分析,相关系数达到0.72,表明灯光数据与工业产值具有较好的相关性。同时,随机选取了全国90个不同市级行政单位(图3),利用ArcGIS的统计工具,将工业产值公里格网数据进行统计,并与市级统计年鉴中计算得到的工业产值数据进行对比。整体而言,平均精度达到80.32%(图4)。不过,部分西部欠发达区域精度略低,其原因在于经济发展水平偏低导致区域灯光强度较弱,且内部差异较小,使得反演精度较低,而环渤海区域、长三角、珠三角等工业较发达区域工业产值反演精度较高。


图3   精度验证选择的90个样本城市的位置


图4   数据集中数据与统计年鉴数据对比及精度
注:横坐标轴为所选验证城市的序号,左侧纵坐标轴为对应该城市的空间化与统计年鉴工业产值,右侧纵坐标轴为该城市的空间化产值数据的验证精度。
本数据处理过程在地理信息系统软件ArcGIS平台下进行,数据处理过程科学合理规范,保证了数据空间分辨率的准确性和可靠性。
4   数据价值
工业产值公里格网数据打破了行政边界的限制,通过夜间灯光数据对工业产值数据进行大尺度反演,得到高精度、高分辨率空间化的栅格数据,从而可以直观地分析工业产值区域间数量差异以及时空分布特征,为划分中国工业重点区域、厘清工业产业变化趋势等提供了数据支撑,特别是为气候变化下工业产业暴露及脆弱性评估提供了基础数据,从而为工业布局规划及极端灾害条件下工业产业受灾预警及灾害评估提供参考,同时,本数据集中工业定义以世界银行中工业定义为准,可用于全球尺度的工业产值变化评估研究。
5   数据使用方法和建议
本数据集可以通过中国科学数据网站(http://www.csdata.org/p/)获取,本数据集中包含工业产值公里格网文件(.tif)和检验数据文件(.xls)以及处理过程数据库(.gdb),可用ArcGIS软件对数据进行读写,也可用 Python 等主流编程语言调用相关函数库读写,实现数据批处理。
数据作者分工职责
薛倩(1993—),女,新疆乌鲁木齐市人,硕士,研究方向为国土资源与3S技术。主要承担工作:数据采集及数据处理。
宋伟(1981—),男,山东沂源人,博士,副研究员,研究方向为土地利用变化及其生态效应。主要承担工作:数据集设计及技术指导。
朱会义(1966—),男,江苏省响水县人,博士,副研究员,研究方向为土地变化。主要承担工作:数据集设计。
[1]
IPCC, Working Group I. Climate Change 2013: The Physical Science Basis.[J]. Contribution of Working, 2013, 43(22): 866–871.
[2]
王守荣. 气候变化对中国经济社会可持续发展的影响与应对[M]. 北京: 科学出版社, 2011.
[3]
Cruz A, Krausmann E. Vulnerability of the oil and gas sector to climate change and extreme weather events[J]. Climatic Change, 2013, 121(1): 41–53.
[4]
Keppenne C, Ghil M. Extreme weather events[J]. Nature, 1992, 358(6387): 547.
[5]
Lereboullet A, Beltrando G, Bardsley D. Socio-ecological adaptation to climate change: A comparative case study from the Mediterranean wine industry in France and Australia[J]. Agriculture Ecosystems & Environment, 2013, 164(164):273–285.
[6]
Sutton P, Costanza R. Global estimates of market and non-market values derived from nighttime satellite imagery, land cover, and ecosystem service valuation[J]. Ecological Economics, 2002, 41(3): 509–527.
[7]
刘永伟, 闫庆武. 基于SLM模型的中国碳排放格网化空间分布模拟[J]. 地理与地理信息科学, 2015, 31(3): 76–80.
[8]
Liu X, Fang C. Wind energy resources distribution and spatial differences of wind power industry in China [C]. Amer Scholars Press, 2007.
[9]
Dong L, Liang H, Gao Z, et al. Spatial distribution of China׳s renewable energy industry: Regional features and implications for a harmonious development future[J]. Renewable & Sustainable Energy Reviews, 2016, 58(4):1521–1531.
[10]
Huang X, Schneider A, Friedl M. Mapping sub-pixel urban expansion in China using MODIS and DMSP/OLS nighttime lights[J]. Remote Sensing of Environment, 2016, 175: 92–108.
[11]
Chen Z, Yu B, Song W, et al. A New Approach for Detecting Urban Centers and Their Spatial Structure With Nighttime Light Remote Sensing[J]. IEEE Transactions on Geoscience & Remote Sensing, 2017, PP(99): 1–15.
[12]
Wang W, Cheng H, Zhang L. Poverty assessment using DMSP/OLS night-time light satellite imagery at a provincial scale in China[J]. Advances in Space Research, 2012, 49(8):1253–1264.
[13]
Wu J, Wang Z, Li W, et al. Exploring factors affecting the relationship between light consumption and GDP based on DMSP/OLS nighttime satellite imagery[J]. Remote Sensing of Environment, 2013, 134(7): 111–119.
[14]
Zhuo L, Zheng J, Zhang X, et al. An improved method of night-time light saturation reduction based on EVI[C]. AAG, Chicago, USA, 2015.
[15]
Wang Z, Yao F, Li W, et al. Saturation Correction for Nighttime Lights Data Based on the Relative NDVI[J]. Remote Sensing, 2017, 9(7):759–772.
[16]
国家统计局. 中国统计年鉴-2011[M]. 2011.
数据引用格式
薛倩, 宋伟, 朱会义. 2010年中国工业产值公里格网数据集[DB/OL]. Science Data Bank, 2017. (2017-09-30). DOI: 10.11922/sciencedb.497.
稿件与作者信息
论文引用格式
薛倩, 宋伟, 朱会义. 2010年中国工业产值公里格网数据集[J/OL]. 中国科学数据, 2017. (2017-10-13). DOI: 10.11922/csdata.2017.14.zh.
薛倩
Xue Qian
薛倩(1993—),女,新疆乌鲁木齐市人,硕士,研究方向为国土资源与3S技术。
宋伟
Song Wei
songw@igsnrr.ac.cn
宋伟(1981—),男,山东沂源人,博士,副研究员,研究方向为土地利用变化及其生态效应。
朱会义
Zhu Huiyi
朱会义(1966—),男,江苏省响水县人,博士,副研究员,研究方向为土地变化。主要承担工作:数据集设计。
出版历史
I区发布时间:2017年10月17日 ( 版本ZH1
参考文献列表中查看
中国科学数据
csdata