数据论文 II 区论文(已发表) 版本 ZH4 Vol 5 (3) 2020
下载
南京百年人物数据集
A dataset of centennial figures in the history of Nanjing
 >>
: 2020 - 01 - 13
: 2020 - 05 - 18
: 2020 - 01 - 15
: 2020 - 08 - 07
1718 10 0
摘要&关键词
摘要:人物数据集是信息化时代历史人物研究的重要基础。本数据集以《民国南京学术人物传》《中华民国史·人物传》和《南京简志》为主要数据源,包含136位自民国至今(即1912年至今)在政治、教育、科技、文学和艺术等领域具有重大影响力的南京籍和客籍历史人物信息,包含人物的通用名称、别名、生卒时间、出生地、经历、人物关系等数据项。本数据集可为南京历史人物信息查询和统计、人物关系可视化和分析及人物生平地图制作等研究提供数据基础,促进南京历史文化的深入挖掘和利用。
关键词:历史GIS;人物数据库;时空数据;历史文化;南京
Abstract & Keywords
Abstract: Profile data is the basis for studies of historical figures in this information age. This study draws sources from published materials including Biography of Academic Figures in Nanjing During the Republic of China, History of the Republic of China, Volume of People, and Concise Chronicles of Nanjing. The dataset records the profile information of 136 natives and non-native residents with great influence in the history of Nanjing, from the fields of politics, education, science and technology, literature and art. It contains such data items as the figure’s common name, alias, date of birth and death, birthplace, experience, and social ties. This dataset can provide bases for wide-ranging research concerning historical figure query and statistics, social tie visualization and analysis, life map generation, and so on, in a way to promote an in-depth mining and utilization of Nanjing history and culture.
Keywords: historical GIS; profile of figures; spatio-temporal data; historical culture; Nanjing
数据库(集)基本信息简介
数据库(集)名称南京百年人物数据集
数据作者郭畅,胡迪,杜晓晗,李岱蔚,杨逸尘,程星华
数据通信作者胡迪(hud316@gmail.com)
数据时间范围1912–2020年
地理区域中国江苏省南京市
数据量136条,136个
数据格式*.xlsx,XML
数据服务系统网址http://www.sciencedb.cn/dataSet/handle/937
基金项目国家自然科学基金(41771421、41601421);江苏高校品牌专业建设工程资助项目。
数据库(集)组成数据集由136位南京杰出历史人物的信息数据组成,包括通用名称、别名、出生时间、出生地点、逝世时间、逝世地点、人物经历、人物关系等数据项。Excel格式文档供普通用户使用,XML格式文档供专业用户使用。
Dataset Profile
TitleA dataset of centennial figures in the history of Nanjing
Data authorsGuo Chang, Hu Di, Du xiaohan, Li daiwei, Yang yichen, Cheng xinghua
Data corresponding authorHu Di(hud316@gmail.com)
Time range1912–2020
Geographical scopeNanjing City, Jiangsu Province
Data volume136 rows, 136 documents
Data format*.xlsx,XML
Data service system<http://www.sciencedb.cn/dataSet/handle/937>
Sources of fundingNational Nature Science Foundation of China (41771421, 41601421); Top-notch Academic Programs Project of Jiangsu Higher Education Institutions (TAPP).
Dataset compositionThe dataset consists of profile data of 136 outstanding historical figures in Nanjing, including common name, alias, date of birth, place of birth, date of death, place of death, experiences, social ties, etc. The data are stored in Excel and XML formats for ordinary and professional uses, respectively.
引 言
古往今来,历史人物一直是历史研究者们关注和研究的重要对象[1]。研究历史人物有助于再现历史舞台,对历史进行再诠释,从而达到鉴古、察今、知来的目的。历史人物的活动受客观社会环境制约,因此,历史人物的生平经历不单是个人的历史,而是包含了一定时空范围内的社会政治和文化背景的大历史[2]。历史人物的数据通常收录于书籍报刊等纸质资料中,零散且更新速度缓慢,难以有效地进行相关深入研究[3]。随着科技的发展,人物数据库应运而生,它对在某一方面乃至多个方面对人类社会做出特殊贡献的典型人物的相关信息进行集中的数字化管理[4]。建立人物数据集能够以人物为中心整合相关信息,不仅能够借助其更新周期短等特点满足更加深入的历史人物研究的需求,进而构建能够反映历史进程的历史信息数据库。
目前的人物数据库根据研究对象的不同可以分为两类:单一人物数据库和群体人物数据库。单一人物数据库从多种信息来源采集研究对象的所有相关资料[5],并对其进行合理罗列。数据格式涵盖文本、图片、音频、视频、网页、地图等多种形式[6-7]。其中较为典型的是蒋介石资料数据库,该数据库收录的资料相当丰富,涵盖了研究对象一生的各个方面(如生平事迹、思想言论和文史著述等)[8]。群体人物数据库是以一定的时间或空间为范围,选取具有某类特征的人物作为研究对象形成的数据库。国外具有代表性的这类数据库是英格兰圣公会神职人员数据库和ASP世界历史人物索引库。前者收录了研究对象的任职时间、职务详情等信息,后者记录了世界历史事件所发生的第一个人物的信息,包括个人信函、日记、口述历史等[9]。国内应用较多的有中国历史人物传记数据库(China Biographic Database,CBDB),其中包含人名、生卒年等数据项[10-11]。CBDB分为线上和Access两种查询系统,它提供多个相互关联的表格,可以将人物信息整理出来,以便学者进行批量分析[12]。另一个著名的人物数据库为湖南近代人物资源库,它包含了高级的检索功能,可以让用户在使用时根据自己的特殊研究需求获取相应的信息[13-14]
南京钟灵毓秀,是著名的文化古都,有着重要的历史地位。自1927年被设为中华民国首都开始,南京市在近百年来飞速发展。在这段历史时期内,政治、教育、科技、文学和艺术等各方面都涌现出了一批杰出的人才,他们为南京的发展做出了重要的贡献,是南京城市史不可或缺的基本构成要素,反应了南京的历史及其特色。建立南京地方人物数据集不仅能够为南京历史人物的进一步研究提供帮助,更能进一步完善中国人物数据库,为历史文化传承做出贡献。因此,本文以1912–2012年南京杰出历史人物为研究对象,查阅并收集有关书籍史志,将所有历史人物资料电子化为Excel表格和XML两种格式的数据集,为进行更深层次的历史人物分析、人物关系和生平地图可视化研究提供基础。
2   数据样本描述
本数据集采用Excel电子表格和XML文件两种数据存储载体。其中Excel电子表格对人物信息进行了合理罗列,可供普通用户进行简单的查询和统计分析。而XML文件不仅易于在任何应用程序中读写数据,便于进行数据交换,而且能够更好地表达人物相关的时空信息、人物关系以及多属性和层次嵌套关系,可支撑进一步的空间分析和可视化研究,因而供专业用户使用。
数据样本展示包括Excel与XML两种格式,如图2和图3所示。


图2   南京百年人物数据集(Excel格式)






图3   南京百年人物数据集(XML格式)
3   数据质量控制和评估
本数据集的数据质量依赖于现有书籍资料记录的完整性和准确性。《民国南京学术人物传》由历史学家张宪文教授编写,《中华民国史·人物传》由中国社会科学院近代史研究所主持编纂,《南京简志》由南京市地方志编纂委员会办公室编著,数据的可信度较高。由于本数据集中所涉及的时间跨度较长,出现了行政区划调整导致的古今地名不统一的现象,因此在数据处理的过程中对县市名进行了修正,一律以现今地名为准。此外,对书籍资料中的部分错误(如人物年龄错误等)进行了勘误。数据录入的完整性和准确性经多次人工检查,确认无误。
4   数据使用方法和建议
本数据集收录了136条南京杰出历史人物数据,可为了解近现代南京杰出人物数据提供一手资料。随着历史人物和地方文化研究的进一步深入,用户不仅可以据此进行综合统计分析,还可以设计特征查询,制作人物关系图和人物生平地图进行可视化表达与研究。
特征查询可通过姓名、别名等人物特征实现对历史人物详细信息的查询(图4)。


图4   南京百年人物数据集查询示意
人物关系图对历史人物的社会关系和亲属关系进行了可视化展示,通过时间轴的控制展现空间对象在某一特定时期内的人物关系,随着时间的改变,可能会出现新增的或发生变更的人物关系。此外,还可以根据关系远近生成关系图谱(图5)。


图5   人物关系图
历史人物生平地图将大量存在于文字中的信息进行可视化表达,以有形的地图语言展现人物生平,能够有效地更加深刻生动地表达历史,同时对历史研究也具有重要作用和意义(图6)。用户可综合多方面的信息来源,进行数据融合、同化和挖掘后提取最有价值的数据信息。


 
[1]
周兴樑. 历史人物研究评价的几个问题[J]. 福建论坛(人文社会科学版), 2004 (6): 57-61.
[2]
段金生. 读王劲教授著《邓宝珊传》——兼谈历史人物研究的魅力[J]. 天水师范学院学报, 2005, 25(4): 127-128.
[3]
洪拓夷, 王增清, 韦云波. 湖州历史人物数据库建设刍议[J]. 兰台世界, 2007 (14): 16-17.
[4]
蔡璐, 罗力可, 伍艺. 试论湖南近代人物数据库建设[J]. 高校图书馆工作, 2009, 29(6): 29-31.
[5]
葛美玲, 田丽君. 成仿吾人物全文数据库构建实践与思考[J]. 兰台世界, 2017(15): 118-120.
[6]
徐晶晶, 葛红梅. 国内图书馆自建人物数据库的现状分析[J]. 数字图书馆论坛, 2015 (12): 50-55.
[7]
张晓源. 人物数据库人物信息收录范围研究[J]. 图书馆论坛, 2004, 24(2): 87-90.
[8]
赵晓红, 周维煦. 人物数据库建设新模式探索——以蒋介石资料数据库为例[J]. 浙江档案, 2016 (6): 15-17.
[9]
刘小花, 罗力可. 基于知识地图的人物数据库模型构建研究[J]. 图书馆, 2013(4): 91-93.
[10]
中国近代人物传记资料库(CBDB)[DB/OL]. [2019-12-28]. https://projects.iq.harvard.edu/chinesecbdb.
[11]
孙妙凝. CBDB体现多学科交叉理念[N]. 中国社会科学报, 2013-04-15(A03).
[12]
徐力恒. 唐代人物资料的数据化:中国历代人物传记资料库(CBDB)近年工作管窥[J]. 唐宋历史评论, 2017 (00): 20-32, 381.
[13]
蔡璐. 浅谈人物数据库网站的核心表现——以湖南近代人物资源库建设为例[J]. 图书馆, 2010 (3): 107-108.
[14]
全丹丹, 李雯. 人物资料数据库优化浅析——以湖南大学图书馆特色数据库《湖南人物库》为例[J]. 高校图书馆工作, 2010, 30(3): 39-41.
[15]
张宪文. 民国南京学术人物传[M]. 南京:南京大学出版社, 2005: 629.
[16]
中国社会科学院近代史研究所. 中华民国史·人物传[M]. 北京:中华书局, 2011: 5593.
[17]
南京市地方志编纂委员会办公室. 南京简志[M]. 南京:南京出版社, 2014.
[18]
胡迪, 闾国年, 江南, 等. 地理与历史双重视角下的历史GIS数据模型[J]. 地球信息科学, 2018, 20(6): 713-720.
[19]
张晓源. 人物数据库人物收录标准研究[J]. 图书与情报, 2006 (1): 69-73.
数据引用格式
郭畅, 胡迪, 杜晓晗, 等. 南京百年人物数据集[DB/OL]. Science Data Bank, 2020. (2020-03-17). DOI: 10.11922/sciencedb.937.
稿件与作者信息
论文引用格式
郭畅, 胡迪, 杜晓晗, 等. 南京百年人物数据集[J/OL]. 中国科学数据, 2020, 5(3). (2020-03-17). DOI: 10.11922/csdata.2020.0001.zh.
郭畅
Guo Chang
主要承担工作:数据的处理、加工,数据集生成,论文的撰写。
(1998—),女,浙江杭州人,本科生,研究方向为地理信息科学。
胡迪
Hu Di
主要承担工作:研究思路设计与论文撰写指导。
hud316@gmail.com
(1984—),男,湖北黄冈人,博士,副教授,硕士生导师,研究方向为时空数据模型、历史GIS。
杜晓晗
Du xiaohan
主要承担工作:数据的处理、加工,数据集生成。
(1999—),女,陕西南郑人,本科生,研究方向为地理信息科学。
李岱蔚
Li daiwei
主要承担工作:数据的处理、加工,数据集生成。
(1998—),男,山西阳泉人,本科生,研究方向为地理信息科学。
杨逸尘
Yang yichen
主要承担工作:数据的处理、加工,数据集生成。
(1999—),男,江苏启东人,本科生,研究方向为地理信息科学。
程星华
Cheng Xinghua
出版历史
I区发布时间:2020年1月15日 ( 版本ZH3
II区出版时间:2020年8月7日 ( 版本ZH4
参考文献列表中查看
中国科学数据
csdata