其他数据论文 I 区论文(评审中) 版本 ZH2
下载
中国名山类唐宋诗词文学景观数据集
A dataset of Tang and Song poetry literature landscape ofChinese eminence mountains
 >>
: 2021 - 02 - 08
: 2021 - 05 - 18
: 2021 - 05 - 18
1279 18 0
摘要&关键词
摘要:文学景观是指与文学家生活、学习、工作、写作、文学活动密切相关的景观,具有一定的文学内涵。古代的文人墨客,大多喜好游历名山大川。中国著名的山峰大多都留下了诗人的足迹,也留下许多脍炙人口的名诗佳句。本研究搜集整理了唐宋时期中国的名山及其相关的诗词和诗人信息,构建了中国名山类诗词文学景观数据集。本数据集包括名山表、诗词表和诗人表,记录了名山、诗词和诗人的信息及三者之间的关联关系。本数据集有利于研究名山与诗词之间的关系,探讨文学景观的形成与发展过程与文学作品、文学活动等影响因素之间的关系,揭示文学景观的形成和发展演化路径。
关键词:文学景观;文学地理;诗词;名山;文学GIS
Abstract & Keywords
Abstract: Literary landscape refers to the landscape closely related to the life, study, work, writing and literary activities of writers, which has certain literary connotations. Ancient literati, mostly like to travel famous mountains and rivers. Most of the famous peaks in China have left the footprints of poets and many famous poems. This study collects and collates the famous mountains in China during the Tang and Song dynasties, and constructs the literary landscape dataset of famous mountains in China. The dataset includes the famous mountain table, the poem table, and the poet table, which records the information of the famous mountain, the poem and the poet and the relationship between the three. This dataset is helpful for studying the relationship between famous mountains and poetry, to explore the relationship between the formation and development of literary landscape and the influencing factors such as literary works and literary activities, and to reveal the formation and evolution path of literary landscape.
Keywords:  literary landscape; literary geography; poetry; famous mountains; literary GIS
数据库(集)基本信息简介
数据库(集)名称中国名山类诗词文学景观数据集
数据作者杜晓晗、胡迪、李岱蔚、周思凡、白天祎
数据通信作者胡迪(hud316@gmail.com)
数据时间范围596–1289年
地理区域今中国行政区划范围
数据量303条
数据格式*.xlsx
数据服务系统网址http://www.dx.doi.org/10.11922/sciencedb.j00001.00232
基金项目国家自然科学基金项目(41771421);南京师范大学教改项目,新工科背景下多学科交叉融合的课程教学模式探索——以《人文社会GIS》为例;江苏高校品牌专业建设工程资助项目。
数据库(集)组成数据集共包括3张Excel数据表,分别为名山表、诗词表和诗人表。名山表包括名山编号、名山类型、社会特征、名山名称、所在省份等字段;诗词表包括诗词编号、诗词名称、作者、朝代、创作时间等字段;诗人表包括诗人编号、姓名、别名、出生时间、逝世时间等。
Dataset Profile
TitleA dataset of Tang and Song Poetry Literature Landscape of Chinese Eminence Mountains
Data corresponding authorHU Di(hud316@gmail.com)
Data authorsDU Xiaohan, HU Di, LI Daiwei, ZHOU Sifan, BAI Tianyi
Time range596–1289
Geographical scopeChina
Data volume303 data entries
Data format*.xlsx
Data service system<http://www.dx.doi.org/10.11922/sciencedb.j00001.00232>
Sources of fundingNational Nature Science Foundation of China (41771421); The Exploration of Multidisciplinary Interdisciplinary Course Teaching Mode under the New Engineering Background of Nanjing Normal University Teaching Reform Project —— Taking Humanistic Social GIS as an Example; Top-notch Academic Programs Project of Jiangsu Higher Education Institutions (TAPP).
Dataset compositionDataset consists of three Excel data tables, which named mountain, poem, and poet. The famous mountain table includes number, type, social characteristic, name, province and so on; the poem table includes number, name, author, dynasty, creation time and so on; the poet table includes number, name, alias, birth time, death time and so on.
引 言
文学景观是指与文学家生活、学习、工作、写作、文学活动密切相关的景观,具有一定的文学内涵[1]。在文学景观的形成和发展演化中,文人及文学作品扮演着重要角色[2]。文学作品不仅是景观的描述,而且帮助塑造了景观[3]。一些平常的景观常因文人的吟咏而声名鹊起,如谢朓所作《游敬亭山》使敬亭山与五岳齐名[4]。目前,关于文学景观研究,主要有曾大兴探讨了文学景观的价值和意义,初步构建起文学景观理论[5];更多研究多聚焦具体文献,从文学作品中的景观入手,侧重其文学属性,而不太关注其地理属性,散点式的个案研究较多而广域式的整体研究偏少[4]。从地理学的视角,以更广阔的时空纬度对一批文学景观做整体研究将能更好地促进文学景观研究。
以GIS为代表的现代信息技术不仅可以存储管理大量时空信息,还可以进行空间分析和地图可视化,为文学研究提供新的方法和技术支撑。目前文学和GIS的结合研究大致分为两类,第一类研究是利用GIS对文学空间进行分析,如张建立等利用“基于古今地名关系的明确定位法”和“方位推测定位、近似替代定位、时空推测定位方法”等解析古诗词文本空间信息[6];李文娟提取了李白、杜甫创作地点及描述地点,采用最邻近指数法、核密度估计法、标准差椭圆法对李杜诗词文学空间模式进行比较研究以及对其空间信息进行专题可视化分析[7];魏丽钦以李杜诗词、黄山文学为例,运用GIS和空间统计学的方法,进行了旅游文学空间、特定作者旅游文学空间、旅游地空间、旅游地等级、旅游地内部景观等文学景观空间可视化表达[8]。第二类研究是文学地图的制作和地理信息平台建设,代表性研究包括中南民族大学王兆鹏教授主持的唐宋文学编年地理信息平台,借助GIS技术将唐宋时期的作家作品按照时空序列完整地呈现在地图上;台湾元智大学罗凤珠教授研发的《唐宋诗词作者及作品分布地理信息系统》建置唐宋诗词作者及作品分布于变迁地图,其作品分布数据不仅与作者有着密切的关联性,而且包含作品相关地点;台湾东吴大学罗丽容教授主持建置的晚明苏州派曲家与GIS以数字人文课程的方式,将GIS系统引进到中文系古典戏曲课程,融合古典戏曲与地理信息系统,将平面概念转为立体行动轨迹,继而进行讲授者、修课学生与文献数据之间的重新对话[9]。这些研究多关注利用GIS呈现文学信息的空间分布特征,而未涉及文学信息空间分布特征内在原因的深入探究。
针对上述问题,本研究借鉴美艾布拉姆斯(M.H.Abrams)提出的文学“四要素”理论,即作品、世界、作家与读者[10],确定中国名山名录,以中国名山类诗词为研究对象,数据源为《全唐诗》、《全宋词》及各名山诗词集,搜集整合各名山诗词,兼顾其地理属性和文学属性,构建了中国名山类唐宋诗词文学景观数据集。本数据可以用于研究名山与诗词之间的关系,探讨文学景观的形成与发展过程与文学作品、文学活动等影响因素之间的关系,为揭示文学景观的形成和发展演化路径奠定基础。
1   数据采集方法
本数据集的数据来源及采集流程如图1所示。所建立的名山表、诗词表和诗人表关系为诗人创作诗词、诗词题材为各名山、诗人游历名山。


图1   数据采集流程
1.1   数据来源
本数据集的名山数据主要来源是韩欣主编的《中国名山》[11]和单树模主编的《中国名山大川辞典》[12]等书籍,这些书籍较为详细地收录了中国的名山,并着重介绍了中国名山的地理位置、自然环境、气候类型、历史文化以及主要景点等方面(图2)。


图2   《中国名山》中的泰山介绍
诗词数据来源于《全唐诗(全25册)》[13]和《全宋词》[14]等,考虑到名山诗词的特殊性,本数据集在收录诗词时还辅以各名山诗词集加以参考补充,比如《黄山古今游览诗选》[16]、《庐山历代诗词全集》[17]等。《全唐诗(全25册)》是清康熙时任江宁织造的曹寅奉康熙皇帝之命,启用当时已退居扬州的彭定求、杨中讷、沈三曾、潘从律、汪士纮、徐树本、车鼎晋、汪绎、查嗣瑮、俞梅10位翰林编撰的,共收录唐朝五代2200余位诗人所作的诗词48900余首,是迄今为止古典诗歌总集中篇幅最多、影响最大的一种(图3)。《全宋词》是据中华书局1979年版唐圭璋编《全宋词》繁体竖排本和1981年版孔凡礼编《全宋词补辑》本改版重排的,旧版《全宋词》在1931年着手编撰,至1937年初稿竣事,后经中华书局文学组对全稿做了订补加工,全书收录词人1330余位,词作19 900余首。
诗人数据主要来源于《中国历代人名大辞典》[15],并参阅其他史料进行补充完善。《中国历代人名大辞典》以商务印书馆1921年出版的《中国人名大辞典》[18]为编纂基础,收录了上起先秦、下迄清末约54 500位历史人物,参与编撰的人员主要分散在复旦大学、华东师范大学、上海大学等高等院校,并且该辞典力求使用第一手资料,人物事迹资料依据可靠(图4)。


图3   《全唐诗》示例


图4   《中国历代人名大辞典》示例
1.2   中国名山确定依据
谢凝高在《中国的名山大川》指出,名山大川主要满足人们对大自然的精神文化生活上的需求,具有独特的文化内涵和景观风貌。其主要特征有三:一是具有美学价值的山川自然景观;二是具有科学和生态学价值的自然景观;三是以自然景观为主,人文景观为辅,自然与人文融为一体的山水景观[19]
本数据集是中国名山类诗词文学景观数据集,首先需要确定本数据选择名山的依据及名山列表。古诗词中结合更多的是有关名山的社会文化色彩,故本数据集中选择收录《中国名山》[11]及《中国名山大川辞典》[12]中有关历史、文化、宗教、政治、**等类型的33座名山,名山名录如表1所示。
表1   名山名录
序号名山名称区域位置依据序号名山名称区域位置依据
1长白山吉林省《中国名山》18武夷山福建省《中国名山》
2千山辽宁省《中国名山》19雁荡山浙江省《中国名山》
3恒山山西省《中国名山》20云台山江苏省《中国名山》
4盘山天津市《中国名山》21钟山江苏省《中国名山》
5五台山山西省《中国名山》22丹霞山广东省《中国名山》
6黄山安徽省《中国名山》23西樵山广东省《中国名山》
7敬亭山安徽省《中国名山大川辞典》24衡山湖南省《中国名山》
8九华山安徽省《中国名山》25韶山湖南省《中国名山》
9龙虎山江西省《中国名山大川辞典》26嵩山河南省《中国名山》
10庐山江西省《中国名山》27武当山湖北省《中国名山》
11普陀山浙江省《中国名山》28岳麓山湖南省《中国名山》
12齐云山安徽省《中国名山大川辞典》29华山陕西省《中国名山》
13清源山福建省《中国名山》30火焰山新疆省《中国名山》
14三清山江西省《中国名山》31麦积山甘肃省《中国名山》
15太姥山福建省《中国名山》32峨眉山四川省《中国名山》
16泰山山东省《中国名山》33青城山四川省《中国名山大川辞典》
17天柱山安徽省《中国名山》
1.3   数据处理
本数据集包括3张表,分别是名山表、诗词表和诗人表,均以人工电子录入的方式采集了地理信息和文学信息。3张表包括的属性字段如表2所示,其中,名山表和诗词表可以通过名山名称字段建立连接,诗词表和诗人表通过作者(即姓名)字段建立连接,以便进行数据表间的关联查询。
表2   中国名山类唐宋诗词文学景观数据集属性字段名称
数据表属性字段
名山表名山编号、名山类型、社会特征、名山名称、其他名称、所在省份、所在城市、具体地址、经纬度、气候类型、主要景点、简介
诗词表诗词编号、诗词名称、作者、朝代、名山名称、创作时间、诗词内容、文献来源
诗人表诗人编号、姓名、别名、字、号、朝代、出生时间、逝世时间、出生地点、逝世地点、特征标签、代表作品
每一座名山都有唯一对应的名山编号,即标识符,其命名格式为2位字母加4位数字,2位字母取自“名山”的拼音首字母,4位数字则表示名山序号。名山类型按所在地理区,即东北、华北、华南、华中、西北和西南分编,涉及的6个地理区按照起首拼音的顺序排列先后,各地理区中均以各名山起首拼音的顺序来排列先后。社会特征是依据名山的历史或者宗教性质等典型社会属性,比如黄山、庐山、雁荡山为三山,泰山、衡山、华山、恒山、嵩山为五岳,武当山、齐云山、青城山、龙虎山为道教名山等。地理位置包括名山所在省份、所在城市、具体地址和经纬度。其中,具体地址来源于高德地图的地名搜索查询功能,经纬度数据来源于高德地图开放平台的坐标拾取器。简介描绘了名山的地质科学意义及美誉等,来源于《中国名山》[11]和《中国名山大川辞典》[12]等书籍的介绍。
本数据集属于中国名山类诗词文学景观数据集,以选录歌咏、纪游名山整体及具体景点的诗词为主,以诗本身的思想性和艺术性的完美统一为标准,既选入名人之作,也收录一般作者的佳作[16]。此外,考虑到不同名山诗词的发展情况因所处社会背景不同具有一定差异性,在遴选诗词的过程中,除《全唐诗(全25册)》和《全宋词》外,本数据集结合各名山诗词发展的文献书籍,作为诗词数据收录的补充和完善,具体文献书籍注明在诗词表的“文献来源”字段中,使得本数据集的数据更加丰富多元,共采集了以唐宋两朝为主,共205首中国名山诗词。
每一首诗都有唯一对应的诗词编号,其命名格式为2位字母加4位数字。2位字母取自“诗词”的拼音首字母,4位数字则表示诗词序号,诗词按名山分编,名山按照起首拼音的顺序排列先后,各名山中以时间顺序来排列先后。诗词表中的创作时间来源于各名山诗词研究文献或权威书籍,对于无法查证创作时间的诗词,以诗人的生卒年份区间代替,生卒年份不可考的数据,一律用“—”代替。
本数据集依据收录的诗词,采集了63位诗人的属性信息,诗人名录如表3所示。每一位诗人都有唯一对应的诗人编号,其命名格式为2位字母加4位数字。2位字母取自“诗人”的拼音首字母,4位数字则表示诗人序号,诗人按朝代顺序分编,各朝代诗人再以诗人姓名起首拼音来排列先后。相关字段信息来源于《中国历代人名大辞典》,并参照其他史料加以补充完善,其中,特征标签为记载了诗人的所属诗词派别或者美誉等信息。
表3   诗人名录
诗人编号姓名朝代出生年份逝世年份诗人编号姓名朝代出生年份逝世年份
SR0001白居易772846SR0033贺铸10521125
SR0002岑参715/717770SR0034洪迈11231202
SR0003褚遂良596/597658/659SR0035黄庭坚10451105
SR0004戴叔伦732789SR0036孔武仲10411097
SR0005杜甫712770SR0037李昴英12001257
SR0006杜牧803852SR0038刘季孙10331092
SR0007高适700765SR0039鲁宗道9661029
SR0008顾况727815SR0040陆游11251210
SR0009韩愈768824SR0041梅尧臣10021060
SR0010贾岛779843SR0042钱熙9531000
SR0011李白701762SR0043区仕衡12171277
SR0012刘禹锡772842SR0044宋祁9981062
SR0013刘长卿789/791SR0045苏轼10371101
SR0014柳宗元773819SR0046苏辙10391112
SR0015罗隐833909SR0047王安石10211086
SR0016孟郊751814SR0048王十朋11121171
SR0017沈佺期713SR0049王挺之
SR0018司空图837908SR0050王文卿10871153
SR0019宋之问712SR0051吴沆11161172
SR0020王勃650676SR0052谢枋得12261289
SR0021王维701761SR0053谢逸10681113
SR0022韦庄836910SR0054辛弃疾11401207
SR0023吴筠778SR0055徐铉917992
SR0024吴武陵835SR0056杨万里11271206
SR0025薛令之683756SR0057于房
SR0026元稹779831SR0058张方平10071091
SR0027张九龄673/678740SR0059张继先10921127
SR0028晁补之10531110SR0060张孝祥11321170
SR0029陈与义10901138SR0061赵抃10081084
SR0030程元风11991269SR0062赵蕃11431229
SR0031范成大11261193SR0063朱熹11301200
SR0032范致冲
名山表和诗词表、诗人表和诗词表中记录的对应关系是一对多,即一座山峰对应多首诗词,一位诗人创作多首诗词;名山表和诗词表中记录的对应关系是多对多,即描述一座名山的诗词可以是多首,一首诗词中也可以包含多座名山。
如图5所示,本数据中收录的有关庐山的诗词中,诗词作者包括白居易、李白、苏轼、洪迈、陆游和杨万里;其中,李白创作的诗词包括《庐山谣寄卢侍御虚舟》和《大林寺桃花》两首,陆游创作的诗词包括《夜闻松声有感》和《初见庐山》两首。
本数据所收录的《留别金陵诸公》(李白),“海水昔飞动,三龙纷战争。钟山危波澜,倾侧骇奔鲸。黄旗一扫荡,割壤开吴京。六代更霸王,遗迹见都)城。至今秦淮间,礼乐秀群英。地扇邹鲁学,诗腾颜谢名。五月金陵西,祖余白下亭。欲寻庐峰顶,先绕汉水行。香炉紫烟灭,瀑布落太清。若攀星辰去,挥手缅含情。”[20]即涉及到诗人对钟山和庐山两座山峰的描写。


图5   所收录庐山诗词及诗词作者
2   数据样本描述
经统计,收集整理唐宋时期中国名山类诗词205首,包括名山表12个属性字段、诗词表8个属性字段、诗人表13个属性字段,每座名山收录的诗词数量如图6所示。其中盘山、清源山、太姥山、云台山、韶山和火焰山的代表诗词现有诗词作品集收录较少,因而本数据集涉及的数量较少。


图6   中国名山类唐宋诗词文学景观收录名山诗词统计图
本数据集共收录27位唐朝诗人的作品共89首,36位宋朝诗人的作品共116首。涉及唐宋诗人及其作品数如图7所示。其中,收录诗词作品数量最多的诗人为李白、陆游。表4所列为收录作品数量为1的诗人。


图7   中国名山类唐宋诗词文学景观收录诗人及名山诗词统计图
表4   中国名山类唐宋诗词文学景观数据集收录作品数量为1的诗人
作品数量(首)诗人姓名
1褚遂良、柳宗元、韦庄、张九龄、罗隐、吴筠、顾况、吴武陵、高适、王勃、沈佺期、薛令之、司空图、谢逸、鲁宗道、程元风、徐铉、孔武仲、张孝祥、王文卿、张继先、张方平、于房、钱熙、吴沆、赵蕃、范致冲、贺铸、谢枋得、李昴英、区仕衡、刘季孙
3   数据质量控制和评估
本数据集的数据质量由现有书籍资料记录的完整性和准确性保证,所涉及书籍资料具有一定权威性,数据可信度高。本数据集中收录的名山诗词,时间范围为唐宋两朝,存在行政区划调整导致古今地名不统一的情况,在处理数据的过程中对县市名进行统一标准,修正为今地名,方便展开研究。此外,数据录入的完整性和准确性经过多次人工检查,确认无误。
4   数据价值
本数据集收录了205首名山代表性诗词,可基于此研究名山与诗词之间的关系,以便探讨文学景观的形成与发展过程与文学作品、文学活动等影响因素之间的关系,揭示文学景观的形成和发展演化路径奠定基础。
此外,本数据集的诗词表中包含诗词创作时间,诗人表同样收录了诗人的生卒年份,通过数据关联的方法,有利于从时间角度出发,依据各诗词创作时间的连续性,探讨不同社会背景下各名山的发展演变情况;有利于从空间角度出发,结合63位诗人的创作经历,挖掘诗人之间未被发现的联系。
[1]
曾大兴. 论文学景观[J]. 陕西理工学院学报(社会科学版), 2014, 32(2): 42–47. DOI:10.3969/j.issn.1673-2936.2014.02.008.
[2]
邵大为, 陈逸云. 建设文学景观数据库的价值与方法: 以《方舆胜览》为例[J]. 中南民族大学学报(人文社会科学版), 2020, 40(1): 107–111. DOI:10.19898/j.cnki.42-1704/c.2020.01.019.
[3]
迈克·克朗. 文化地理学[M]. 杨淑华等, 译. 南京: 南京大学出版社, 2003: 55.
[4]
曾大兴. 文学景观研究[J]. 广东技术师范学院学报(社会科学版), 2011, 32(2): 76–80. DOI:10.3969/j.issn.1672-402X.2011.02.021.
[5]
高建新. 文学景观理论的建构及其意义[J]. 世界文学评论, 2017(2): 179–183.
[6]
张建立, 李仁杰, 傅学庆, 等. 古诗词文本的空间信息解析与可视化分析[J]. 地球信息科学学报, 2014, 16(6): 890–897. DOI:10.3724/SP.J.1047.2014.00890.
[7]
李文娟. 基于GIS及空间统计方法的诗词文学空间模式研究: 以李杜诗词为例[D]. 石家庄: 河北师范大学, 2015.
[8]
魏丽钦. 旅游文学数据库设计与可视化研究[D]. 石家庄: 河北师范大学, 2017.
[9]
毛建军, 张三夕, 等. 历史地图GIS与古典文学研究[J]. 华中学术, 2017(3): 66–71.
[10]
ABRAMS M H. 镜与灯: 浪漫主义文论及批评传统[M]. 郦稚牛等, 译. 北京: 北京大学出版社, 2015.
[11]
韩欣. 中国名山[M]. 北京: 东方出版社, 2008.
[12]
单树模. 中国名山大川辞典[M]. 济南: 山东教育出版社, 1992.
[13]
彭定求. 全唐诗(全25册)[M]. 北京: 中华书局, 2018.
[14]
唐圭璋. 全宋词 (增订简体本·全5册) [M]. 北京: 中华书局, 2018.
[15]
张撝之, 沈起炜. 中国历代人名大辞典(上下) [M]. 上海: 上海古籍出版社, 1999.
[16]
黄松林. 黄山古今游览诗选[M]. 合肥: 黄山书社, 1989.
[17]
郑翔, 胡迎建. 庐山历代诗词全集[M]. 上海古籍出版社, 2010.
[18]
王存. 中国人名大辞典[M]. 北京: 商务印书馆, 1998.
[19]
谢凝高. 中国的名山大川[M]. 北京: 中国国际广播出版社, 2010.
[20]
吕华明. 李太白年谱补正[M]. 北京: 中华书局, 2012.
数据引用格式
杜晓晗, 胡迪, 李岱蔚, 等. 中国名山类诗词文学景观数据集[DB/OL]. Science Data Bank, 2021. (2021-05-18). DOI: 10.11922/sciencedb.j00001.00232.
稿件与作者信息
论文引用格式
杜晓晗, 胡迪, 李岱蔚, 等. 中国名山类诗词文学景观数据集[J/OL]. 中国科学数据, 2021. (2021-05-18). DOI: 10.11922/csdata.2021.0016.zh.
杜晓晗
DU Xiaohan
主要承担工作:数据的处理、加工,数据集生成,论文撰写。
(1999—),女,陕西南郑人,本科生,研究方向为地理信息科学。
胡迪
HU Di
主要承担工作:研究思路设计与论文撰写指导。
hud316@gmail.com
(1984—),男,湖北黄冈人,博士,副教授,硕士生导师,研究方向为时空数据模型、历史GIS。
李岱蔚
LI Daiwei
主要承担工作:数据的处理、加工,数据集生成。
(1998—),男,山西阳泉人,本科生,研究方向为地理信息科学。
周思凡
ZHOU Sifan
主要承担工作:数据的处理、加工,数据集生成。
(2000—),女,江苏宿迁人,本科生,研究方向为地理信息科学。
白天祎
BAI Tianyi
主要承担工作:研究思路探讨。
(2000—),女,河北唐山人,本科生,研究方向为地理信息科学。
出版历史
I区发布时间:2021年5月18日 ( 版本ZH2
参考文献列表中查看
中国科学数据
csdata