其他数据论文 I 区论文(评审中) 版本 ZH2
下载
中国区县级人口普查GIS数据集(1953–2010年)
District/County Level Population Census GIS Datasets in China (1953–2010)
 >>
: 2021 - 06 - 02
: 2021 - 08 - 13
: 2021 - 08 - 13
1319 13 0
摘要&关键词
摘要:人口空间化数据对于支持交通、地理、社会经济、可持续发展等方面的研究具有重要意义。本文搜集1949年以来中国六次人口普查的区县级人口统计数据。以2010年(第六次人口普查年)区县级行政区划为区县行政区的地理区域基准,对人口统计数据进行空间化校准,经空间化处理,生成区县级GIS人口数据集。
关键词:人口普查;空间化;区县;中国
Abstract & Keywords
Abstract: Spatialized population data is of great importance in supporting the studies on transportation, geography, socio-economy, sustainable development etc. In this paper, we collect the population data in district-county level of six Population Censuses in China from 1949. With the administrative division in 2010, which is the year of the sixth Population Census, as the benchmark of the geographical region of the districts and counties, population data is calibrated and spatialized. Finally, the GIS Population Datasets for Six Population Censuses in China are produced.
Keywords: population census; spatialization; district-county; China
数据库(集)基本信息简介
数据集名称中国区县级人口普查GIS数据集(1953–2010年)
数据作者高亮、宋栋栋、杨一涛、徐长兴、杨小宝
数据通信作者高亮(lianggao@bjtu.edu.cn)
数据时间范围1953年,1964年,1982年,1990年,2000年,2010年
地理区域中国大陆
数据量67.6 MB
数据格式*.shp, *.cpg, *.dbf, *.prj, *.sbn, *.sbx, *.shx
数据服务系统网址http://www.doi.org/10.11922/sciencedb.j00001.00273
基金项目国家自然科学基金(71571017,91646124,71621001,91746201)
数据库(集)组成本数据集包含“县区_POP_20210602.rar”包含经过编码、属性连接等形成中国31省(直辖市、自治区)(香港、澳门、台湾省除外)区县级GIS人口数据集。数据量为67.6 MB。
Dataset Profile
TitleDistrict/County Level GIS Population Datasets for Six Population Censuses in China (1953–2010)
Data corresponding authorGAO Liang (lianggao@bjtu.edu.cn)
Data author(s)GAO Liang,SONG Dongdong, YANGYitao, XU Changxing, YANG Xiaobao
Time range1953, 1964, 1982, 1990, 2000, 2010
Geographical scopeChinese mainland
Data volume67.6 MB
Data format(*.shp, *.cpg, *.dbf, *.prj, *.sbn, *.sbx, *.shx)
Data service system<http://www.doi.org/10.11922/sciencedb.j00001.00273>
Source(s) of fundingNational Natural Science Foundation of China (71571017, 91646124, 71621001, 91746201)
Dataset compositionThe data set consists of one part: Dataset Map.zip contains the coded and attributed links to form a district/county level GIS population database of 31 provinces (municipalities, autonomous regions) (excluding Hong Kong, Macao, and Taiwan). The amount of data is 67.6 MB.
引 言
人口数据为城市规划[1]、交通[2-4]、气候与环境[5-6]、地理[2,7]、社会科学[3,8-9]、经济与管理[3,8-9]等相关科学领域提供重要的基础数据支撑,对这些学科的发展具有重要意义。近年来,人口数据生产也得到了国内外研究者的重视[10-15]
新中国成立到2010,我国开展了六次全国人口普查,涉及全国31个省(直辖市、自治区)。六次人口普查,投入人力、物力、财力充足,人口统计数据精度较高。以此为基础,生成空间化人口数据,数据质量较高。因此,本文采集六次人口普查年对应的人口统计数据,经过数据校准和空间化处理,得到了“中国区县级人口普查GIS数据集(1953–2010)”。
已有中国人口数据生产,主要采用网格/栅格划分全国的地理区域,为了获取每个网格的人口数据,需要对高级别行政区域人口数据,进行必要的数据变换,最终输出数据产品[10,12-13,15]。本文以实际区县级行政区域划分全国的地理区域,每个区县级行政区在人口普查中,都有对应的人口数据,不需要进行数据变换,避免了数据变换过程中产生的系统性数据误差。另外,以区县级行政区为生产人口数据的基本地理单元,可以较好地反映人们的出行或迁移等相关特征,提高相关研究结果的准确性和应用性。
1   数据采集和处理方法
1.1   数据来源
本数据集的核心数据源为中国六次人口普查的人口数据(香港、澳门、台湾省除外)。在数据集制作过程中,具体用到的数据集包括:国家统计局发布的区县级人口统计数据(http://www.stats.gov.cn);2015年全国区县级行政区划GIS矢量数据(http://www.resdc.cn),其地理参考为WGS84 坐标系。
1.2   数据处理
相对于2015年的行政区划,我国前五次人口普查年对应的行政区划发生了变化。包括区县更名、行政区等级或属性发生改变,以及行政区的合并或拆分。对于上述变化,以2015年全国区县级行政区划为基准,对前五次人口普查年对应的行政区划矢量数据进行数据校准,得到行政区划校准数据。
接着,将对应的人口统计数据与区县级行政区进行匹配。例如,1953年某个行政区,2015年时已经被拆分,假设1953年该行政区内人口分布是均匀的,那么,按2015年拆分后所得各行政区面积比例,将1953年该行政区人口数据拆分到2015年新行政区中。
最后,以2015年行政区划为基准,在2015年区县行政区GIS数据基础上,将人口数据进行空间化处理,得到“中国区县级人口普查数据集(1953-2010)”。
综上,本文数据集生产技术路线如图1所示。


图1   数据集生产技术路线图
1.2.2   区县级人口数据空间化处理
(1)区县级行政区划数据校准。本文所生产的数据集以2015年区县级行政区划为基准,对1953年至2010年六次全国人口普查时,区县级行政区划进行校准。其中,根据区县级行政区的调整,合并或拆分了一些区县级行政区。
(2)人口普查数据的行政区划校准。假设各区县级行政区内人口是均匀分布的,生成相对于2015年行政区划发生了调整的区县级行政的人口数据。
(3)人口普查数据的空间化处理。本文获取中国科学院资源环境科学数据中心提供的2015年全国区县级行政区划矢量数据集(http://www.resdc.cn)。将六次全国人口普查数据与2015年全国区县级行政区矢量数据,建立空间关联。最终,得到中国31省(直辖市、自治区)2866个区县级行政区的人口空间数据集。
2   数据样本描述
经过处理,中国31省(直辖市、自治区)区县人口分布如图2所示。


图2   2010年第六次人口普查人口分布图
3   数据质量控制和评估
主要通过以下手段对数据集进行质量控制:
(1)2015年区县级行政区矢量数据,来源于中国科学院资源环境科学数据中心,数据来源真实可靠,数据格式、内容规范。
(2)六次人口普查数据来源于中国国家统计局,公布的人口普查年(1953年、1964年、1982年、1990年、2000年、2010年)的统计年鉴,数据来源可靠,数据内容规范。
(3)人口统计数据与区县级行政区进行地理空间匹配过程中,对发生了拆分的行政区,假设其人口空间分布均匀,进而以区域面积比例分配人口量。
由于六次人口普查数据中,海南省部分区县人口数据缺失,图2中显示为空白。
4   数据使用方法和建议
中国31省(直辖市、自治区)(香港、澳门、台湾省除外)六次人口普查区县级GIS人口数据集,可用ArcGIS等地理信息系统软件打开。本数据集可直接用于我国人口分布的时空演化特性研究。同时,本数据集可进一步支持交通、地理、社会科学、经济与管理等方面与人口迁移演化相关的课题研究。本课题组正基于该数据集,研究全国范围内交通系统,随人口空间分布变化的演化规律,欢迎感兴趣的课题组,参与深入讨论。
致 谢
感谢北京交通大学2019年春季大系统理论课上参与原始数据采集的全体同学。
[1]
FANG Y, JAWITZ J W. The evolution of human population distance to water in the USA from 1790 to 2010[J]. Nature Communications, 2019, 10(1): 1–8. DOI:10.1038/s41467-019-08366-z.
[2]
张君, 薛亮, 延军平. 陕北黄土高原人类活动价值度变化分析[J]. 干旱区资源与环境, 2020, 34(9): 1–8. DOI:10.13448/j.cnki.jalre.2020.232.
[3]
FLÜCKIGER M, LUDWIG M. Transport infrastructure, growth and persistence: The rise and demise of the Sui Canal[J]. Canadian Journal of Economics, 2019, 52(2): 624–666. DOI:10.1111/caje.12378.
[4]
BU C J, CUI X Q, LI R Y, et al. Achieving net-zero emissions in China's passenger transport sector through regionally tailored mitigation strategies[J]. Applied Energy, 2021, 284: 116265. DOI:10.1016/j.apenergy.2020.116265.
[5]
MANOLI G, FATICHI S, SCHLÄPFER M, et al. Magnitude of urban heat Islands largely explained by climate and population[J]. Nature, 2019, 573(7772): 55–60. DOI:10.1038/s41586-019-1512-9.
[6]
LI D J, STUCKY B J, DECK J, et al. The effect of urbanization on plant phenology depends on regional temperature[J]. Nature Ecology & Evolution, 2019, 3(12): 1661–1667. DOI:10.1038/s41559-019-1004-1.
[7]
柏中强, 王卷乐, 杨雅萍, 等. 基于乡镇尺度的中国25省区人口分布特征及影响因素[J]. 地理学报, 2015, 70(8): 1229–1242. DOI:10.11821/dlxb201508004.
[8]
GAO J, ZHANG Y C, ZHOU T. Computational socioeconomics[J]. Physics Reports, 2019, 817: 1–104. DOI:10.1016/j.physrep.2019.05.002.
[9]
DONG L, RATTI C, ZHENG S Q. Predicting neighborhoods’ socioeconomic attributes using restaurant data[J]. PNAS, 2019, 116(31): 15447–15452. DOI:10.1073/pnas.1903064116.
[10]
柏中强, 王卷乐. 中国27省乡镇(街道)级人口密度数据集(2000年)[J]. 中国科学数据, 2016, 1: 37–42.
[11]
王明明, 王卷乐. 山东省街道/乡镇级格网化人口空间分布数据集(2000、2010年)[J]. 中国科学数据, 2019, 4: 182–192.
[12]
王卷乐, 王晓洁, 王明明, 等. 中国乡镇(街道)人口密度数据集(2010年)[J/OL]. 中国科学数据, 2020, 5(3). (2020-09-11). DOI: 10.11922/csdata.2020.0013.zh.
[13]
GAUGHAN A, STEVENS F, HUANG Z, et al. Spatiotemporal patterns of population in mainland China, 1990 to 2010 [J]. Scientific Data, 2016, 3. DOI:10.1038/sdata.2016.5.
[14]
MEYER M F, LABOU S G, CRAMER A N, et al. The global lake area, climate, and population dataset[J]. Scientific Data, 2020, 7: 174. DOI:10.1038/s41597-020-0517-4.
[15]
CHEN Y D, GUO F, WANG J C, et al. Provincial and gridded population projection for China under shared socioeconomic pathways from 2010 to 2100[J]. Scientific Data, 2020, 7: 83. DOI:10.1038/s41597-020-0421-y.
数据引用格式
高亮, 宋栋栋, 杨一涛, 等. 中国区县级人口普查GIS数据集(1953–2010年)[DB/OL]. Science Data Bank, 2021. (2021-08-13). DOI: 10.11922/sciencedb.j00001.00273.
稿件与作者信息
论文引用格式
宋栋栋, 高亮, 杨一涛, 等. 中国区县级人口普查GIS数据集(1953–2010年)[J/OL]. 中国科学数据, 2021. (2021-06-02). DOI: 10.11922/csdata.2021.0034.zh.
宋栋栋
Dongdong Song
主要承担工作:数据集制作,论文撰写,样本数据分析。
(1995—),男,甘肃天水人,博士研究生,研究方向为交通系统复杂性。
高亮
Liang Gao
主要承担工作:课题设计,数据集制作,论文撰写,样本数据分析。
lianggao@bjtu.edu.cn
(1979—),男,黑龙江齐齐哈尔人,博士,副教授,研究方向为复杂网络、复杂系统管理、交通系统复杂性。
杨一涛
Yitao Yang
主要承担工作:数据集制作。
(1995—),男,安徽合肥人,博士研究生,研究方向为交通系统复杂性。
徐长兴
Changxing Xu
主要承担工作:数据集制作。
(1990—),男,山东菏泽人,硕士研究生,研究方向为交通系统复杂性。
杨小宝
Xiaobao Yang
主要承担工作:论文撰写。
(1981—),男,江西吉安人,博士,教授,研究方向为交通系统复杂性、交通行为与安全。
出版历史
I区发布时间:2021年8月13日 ( 版本ZH2
参考文献列表中查看
中国科学数据
csdata