其他数据论文 II 区论文(已发表) 版本 ZH2 Vol 6 (1) 2021
下载
中国科学院西部地区科技工作者的文化类型数据集
A dataset of cultural types of scientific and technological workers in an Institute of Chinese Academy of Sciences in the Western China
 >>
: 2019 - 08 - 27
: 2020 - 08 - 25
: 2019 - 09 - 10
: 2021 - 03 - 31
1691 5 0
摘要&关键词
摘要:当代自然科学研究工作中,更好体现文化因素作用的需求日益显著。在人类与自然关系研究中,当地居民的生活方式、文化服务,以及他们所掌握的文化知识都是构建生态系统综合服务体系和环境治理的关键。Mary Douglas的文化理论为人类的文化偏好判定提供了有效的视角,使得地理学者、生物多样性专家、人类社会学家及管理决策者等在文化问题上的合作越来越普及。根据该理论,本调查构建了包含自然感知、社会认知、人际关系处理以及自我反思等4个方面共40个选题的判定问卷,围绕个人主义、等级主义、平等主义及宿命论等4个文化类型于2019年5月和10月,面向中国科学院西部地区科技工作者开展两步调查工作。第一步预测试邀请10位不同岗位的科技工作者参与答题与自评,并邀请了9位掌握或已学习文化理论且认识所有预测试被试者3年及以上的评定专家参与问卷验证。验证结果表明,问卷有高度一致性、可靠性和内容效度,其中被试自评的一致率为0.9,标度一致性的Kappa系数为0.861。第二步网络调查面向中国科学院西部地区某单位,共收集了181条数据,其中有效数据160条。数据质量评估的一致率为0.762,Kappa系数为0.623,表明具有高度的一致性。调查结果显示,中国科学院西部地区的科技工作者中,等级主义和平等主义分别占47%和45%,个人主义者占6%,宿命论者为2%。通过本数据集,还可以分析不同性别、年龄及岗位的科技工作者的文化类型和工作态度。
关键词:文化理论;文化类型;科技工作者;调查统计
Abstract & Keywords
Abstract: In modern research on natural science, there is an increasingly prominent demand from different fields to better reflect the role of cultural factors. When it comes to the study on human-nature relations, for example, the lifestyle, cultural services and cultural knowledge of local residents are the key to the construction of integrated ecosystem services and environmental governance. Mary Douglas’s cultural theory provides an effective perspective for the judgment of human cultural preference, promoting more and more cooperation in cultural issues between geographers, biodiversity experts, human sociologists and management decision-makers. According to the theory, we constructed in the survey a judgement questionnaire with 40 topics, including natural perception, social cognition, interpersonal relationship processing and self- reflection. In May and October, 2019, we conducted a two-step survey on scientific and technological (S&T) workers in western institute of the Chinese Academy of Sciences by focusing on the four cultural types, namely individualism, hierarchy, egalitarianism and fatalism. Firstly, we carried out the pre-test by inviting 10 S&T workers from different posts to answer the questions in a questionnaire and doing self-reflection, and then asking 9 experts who are equipped with cultural theory and have known all the testees for over 3 years to engage in the questionnaire verification. The verification results show that the questionnaire has high consistency, reliability and content validity. The consistency rate of self-evaluation is 0.9, and the Kappa coefficient of scale consistency is 0.861. Secondly, we carried out a network survey in an institute of the Chinese Academy of Sciences in Western China. We collected a total of 181 data, of which 160 were valid data. The survey results show that among these S&T workers, 47% are hierarchical and 45% are egalitarian, 6% are individualist and 2% are fatalistic. With the help of this dataset, researchers can analyze the cultural types and work attitudes of S&T workers of different genders, ages and posts.
Keywords: cultural theory; cultural type; S&T worker; statistic survey
数据库(集)基本信息简介
数据库(集)名称中国科学院西部地区科技工作者的文化类型数据集
数据作者王肖波,徐中民,赵雪茹
数据通信作者王肖波(wangxiaobo@lzb.ac.cn)
数据时间范围2019年
调查范围中国科学院西部地区科技工作者
数据量50 KB
数据格式*.xlsx
数据服务系统网址http://www.sciencedb.cn/dataSet/handle/858
基金项目国家重点研发计划专项课题(2018YFD1100102);兰州资源环境科学大型仪器区域中心自主知识课题(lz201901)。
数据库(集)组成数据集分别由问卷和有效样本数据2部分组成。《基于社会认知的文化类型调查》问卷由40个题项构成;有效样本数据包含160条数据,每条由50个字段组成,其中前5个字段是基本信息,后5个字段是结果信息。
Dataset Profile
TitleA dataset of cultural types of scientific and technological workers in an Institute of Chinese Academy of Sciences in the Western China
Data corresponding authorWANG Xiaobo (wangxiaobo@lzb.ac.cn)
Data authorsWANG Xiaobo, XU Zhongmin, ZHAO Xueru
Time rangeMay & October,2019
Geographical scopeA Western Institute of Chinese Academy of Science
Data volume50 KB,160entries
Data format*.xlsx
Data service systemhttp://www.sciencedb.cn/dataSet/handle/858
Sources of fundingNational Key Research and Development Program (2018YFD1100102); Autonomous knowledge subject of the Lanzhou Regional Center of Resources and Environmental Scientific Instrument (lz201901).
Dataset compositionThe dataset contains statistical questionnaire and valid sample data. The questionnaire A Survey on Cultural Types Based on Social Cognition consists of 40 questions. The data comprise 160 entries, each with 50 fields, of which the first five fields denote the basic information,and the last five stand for the judgement result.
引 言
文化(Culture)曾是人类学家主要领域,但现在也被诸多地理学者、生态学家以及管理决策者等所采用。比如在过去30年人地关系研究发展中,文化已是地理学科和相关领域视为工作中一个重要变量[1]。其中,从事生态系统服务评估和保护的研究人员,现在已认识到文化价值是保护生态系统最令人信服的理由之一。再如,开展自然地理调查和研究的专家学者也意识到当地居民和他们所掌握的文化知识是生态保护、资源利用和环境治理的关键。在20世纪末,Costanza等[2]人将文化(价值)定义为“人地系统审美、艺术、教育、精神和/或科学的价值”。2005年,千禧年生态系统评估[3]扩大了此定义,将人们通过知识增长、认知发展、精神反思、娱乐和审美体验纳入人地系统的非物质利益之中,使得文化作用涵盖了教育学习机会、社会关系维持及审美价值供应。可见文化因素事实上时刻以世界观、信仰体系和其他多样的方式体现在人类的日常生活和行为决策之中[4]
虽然文化时空维度,比如国家或地区,特别是领地、习俗或语言方面相当“有形”而可区别,但在意识层面却是无形。这些文化因素在人们日常生活中已经完全内化且习以为常,很难令人有意识地表达文化的属性或特征,也难以为人所辨识。得益于社会文化可行性理论,也即文化理论[5],可以帮助辨析人类日常生活中隐含的文化因素。在文化理论的框架下,文化被定义为证明和稳定一个组织的态度和价值观,并区分了5种基本的社会文化行为和态度的表现(Performance)[6]。因为第5种类型(Autonomy)是其他4种类型的综合,是4种不同文化偏好(Culture Bias)的完美平衡,但这类人非常少[6]。所以根据不同的偏好,一般将人们的生活方式归为4类,即个人主义(Individualism)、等级主义(Hierarchy)、平等主义(Egalitarianism)及宿命论(Fatalism)。Bruner[7]早前从心理学的角度证明,文化具有经验编辑、实践价值观、为潜在行动提供评估标准以及经验和期望分享的功能。如此,从不同文化类型的角度解析不同区域人们的生活方式,可以为人地关系、人际关系乃至自我管理的解耦提供一种新的视角。为此,本文设计开发《基于社会认知的生活方式调查问卷》,尝试分型同质工作类型人员的不同生活方式,可为往后开展深入的人地关系、人际关系以及决策分析等提供调查方法和统计数据支持。
1   数据采集和处理方法
本数据集的取得由问卷开发、数据采集和数据清洗等3个步骤组成。
1.1   问卷开发
本调查的问卷分两步开发。
(1)框架设计
正如中国传统文化中“道法自然”的说法,文化理论[5-6]是从人们对自然不同的认知着手,进而反推人类自身不同的行为准则——“道”。鉴于此,文化理论学家归纳了人们4种通行的自然观念,即有4类人分别认可自然的宽厚、耐受、脆弱及无常[6],见表1。这种偏好,换言之世界观,包含了自我反省、人际关系处理、社会认知以及自然感知。对于个人而言,也就表现了不同的价值观和信仰[5,6]。据此,文化理论将现实中人们的生活方式区分为4种类型,分别是个人主义者(Individualist)、等级主义者(Hierarchist)、平等主义者(the Egalitarian)以及宿命论者(Fatalist)[6]。表1根据理论定义,结合中国传统文化思想简述了4种不同生活方式的自然认知和逻辑特征。
表1   不同生活方式的自然认知和价值特征[6]
1. 自然是宽厚的
2. 自然包容人们无限试错,直到最优解
3. 相信并只关心自己,肯定竞争的作用
4. 认为人应自利
5. 座右铭:达则兼济天下
个人
主义
1. 自然是耐受的
2. 自然在一定程度内是稳定的,要讲究度
3. 相信制度与专家意见,肯定层级的作用
4. 认为人生而有罪
5. 座右铭:有所为有所不为
等级
主义
平均
主义
1. 自然是脆弱的
2. 自然是短暂的,任何扰动都可能崩坏
3. 相信集体,注重公平的作用
4. 认为人性本善
5. 座右铭:兼爱
宿命

1. 自然是无常的
2. 自然是反复的,人类无法学习和预知
3. 相信运气,强调命运的作用
4. 认为人心易变
5. 座右铭:随遇而安
由于明确调查工作在国内展开,在兼顾民族异质性的基础上,在问卷的框架设计中融入了传统中华文化的逻辑思维。具体以“天人合一”为蓝本,如图1所示,“天”代表蕴含着“道”、“真理”和“法则”的自然和社会,“人”则包含他人与自我,指代具体的人际关系和自我反省。其中,对自然的观念源于人们与自然之间关系的平衡,涉及到感知和利用两个过程。感知的内容包含天候、景观、变迁、灾难和复原(C1-C5),利用则包含资源观、开发、管理、治理及平衡(C6-C10)。对社会的观念从对社会现象的看法和在具体社会参与的过程两个方面,从生产生活生态的角度可以将前者归纳为生产力、生产关系、法律法规、道德纪律、资源资料及地域风俗(C11-C16)等,后者涉及政治、经济、文化、社区公共事务、关系网络维持及风险感知(C17-C22)等。关于人的部分,对自我的认知从性格、兴趣、技能和价值观等4个方面进行刻画,并为保证判定的准确性,对每个方面选取3个不同的视角进行表征(C23-C34)。对他人的认知既是社会认知与人际关系判断的基础,也是对自我认知的补充,可从对“温良恭俭让”(C35-C39)及人性(C40)的看法进行综合考量。


图1   调查问卷的框架设计
综上,充分反映被试文化类型(生活方式)的判定题目经多次研讨完善确定为40个,涉及4个方面。
(2)题目编制
在完成基于文化理论的问卷框架后,根据具体面向对象编制具体的题目。题目编制的基本要素来源于国外相关社会学研究人员[8-9]开发调查问卷的思路和方法。
首先,对以往研究人员用于观点偏好量级的题目转换为本调查研究所需的答案,合并同类后根据本调查的问卷框架进行题目编写。所谓观点,即观察事物时所处的立场或出发点,抑或从一定的立场或角度出发,对事物或问题所持的看法。不同文化类型的人对待事物会有不同的观点,因此对同一个观点,会有不同的偏好量级。本调查研究并不采用这种处理方式,而是将不同观点进行归类。比如,属于等级主义者的观点,即为等级主义者对某事物的看法,进而提炼对待相同事物时,其余文化类型者的观点。
然后,考虑到本次调查研究的被试群体是中国科学院西部地区的科技工作者,包含科研、技术及管理等岗位的工作人员,具备一定的知识水平和开阔的视野,长期从事科研技术管理服务相关工作。为避免调查中可能产生的掩饰和失实,题目整体围绕特定的情景“感知自然”展开,进而结合被试的社会认知和自我反思判定其生活方式,也即初步判定的文化类型。于是,本调查问卷包含开篇问候、主体试题和背景信息3个部分组成。
开篇问候其实也是问卷说明,既是引起被试者的兴趣和重视,也是为了消除被试者的顾虑和犹疑。因为问卷需自主填写,所以对被试者的要求都简明扼要又不引起反感地表述在开篇第一句之中。
主体试题是问卷的核心部分,包括全部问题和答案,共计40道题目,160个选项。本调查问卷采用封闭式提问,即在每个问题后面给出4个选择答案,被试者只能在其中选一个第一印象认可或自己最能接受的选项。为防止答题出现都选一个选项的情况,所有的答案按一定顺序进行变换。示例见表2,详见数据集。
表2   基于生活认知的科技工作者文化类型问卷题目示例
序号维度(潜变量)题目(情景)答案(显变量)
1自然Q1关于天气异常现象,您认为A 是气候变化,专家说的
B 是自然环境破坏引起的
C 是正常的,没注意也不关心
D 是一轮一轮的,以前就这样
Q24关于人类破坏自然,您认为A 大自然会怎么做,只有天晓得
B 大自然会就事论事,有规则
C 大自然会有错必究,牵连一大片
D 大自然会宽容人类
2社会Q9关于村容村貌整治,您认为A 只要是政府规定,就应该做
B 维护村庄形象,人人有责
C 对大家有利,个人应不反对
D 形象工程,浪费人力物力
Q36 对生活中出现的意外,您认为A 是命运的安排,个人无法改变
B 是水平更差的人反而把事做好了
C 不是自己失败了,而是成功了
D 是自己失败了,可能是运气不好
3他人Q16 关于人的天性,您认为A 人性嬗变,无人知晓未来
B 生来有罪,需要规范救赎
C 本性善良,会被后天带坏
D 天生利己,应当优胜劣汰
Q28 您认为一个人成功的关键在于A 时来运转
B 贵人相助
C 与人为善
D 自强不息
4自我Q18 整体上讲,您认为自己A 重公平、守约定
B 高目标、有冲劲
C 易相处、好说话
D讲原则、明是非
Q40 如作为贫困村长,哪件事最值得您高兴A 熬出来了,从没出差错
B 得到上级肯定,能提拔
C 融入了集体,得到认可
D 攻坚克难,达成了目标
背景信息包括被试者的性别、年龄和工作岗位,由被试者自行决定是否填写。其中岗位包括科研、技术、管理及辅助4个类型,辅助岗位指的是从事科技相关工作的长期聘用人员或在读研究生。
(3)判定机制
因为人类思维的复杂性,以往大多问卷的开发都采用既定的工作范式,以量表的形式根据对被试者在某一观点的偏好程度,来刻画其某种文化类型的倾向。这种做法的结果是,在4种不同类型的观点上面,都将得到一个程度值,然后根据每个类型值的平均值的大小判定被试者的文化类型。事实上,这种方法存在系统误差。以Likert五级量表为例,比如在等级主义类型范畴内的AB两个问题上,被试者甲的评级分别为2和5,而乙是3和4;两者的平均分都是3.5,>3,理论上表明两者都有该类型的倾向,且具有相同的倾向程度。但实际上评分3分代表中立,2分表明不认同。这说明,甲在A问题上的偏好并非认同等级主义类型;同时从B问题来看,甲又比乙更加倾向该类型。但这些信息都被平均后的终值抹去。因此,A问题在作为判定他们文化类型的效用上就会存疑。同理,会有一系列的问题始终围绕问卷产生。
鉴于文化类型的分类本身就是对4种不同观点的倾向,表明每个自然人都或多或少保有这4种类型的偏好。因此,选择一件明晰的事物,从4种类型偏好的视角给予解读,可以形成4个观点各异的答案。那么,持有不同偏好观点的人自然会根据最符合自身的立场进行选择。于是,以此通过计数的方式刻画其不同类型的倾向性,对被试者回答40道题目的答案类型进行汇总,分别对应等级主义、平等主义、个人主义及宿命论的编码类别进行计数,以数量超过10作为具备倾向性的阈值,并以数量最大者作为判定依据,判定被试者的文化类型。若某人4种类型汇总后的最大数为2个或3个相同的数,则根据文化理论定义按照等级主义、个人主义、平等主义的顺序依次优先判定。比如某人答题后等级主义、平等主义、个人主义及宿命论的得分分别为13、19、2及6,那么该人同时具备等级主义和平等主义倾向,但平等主义更显著,故判定其为平等主义者。又如某人答题后的得分分别是14、14、9及3,判定其为等级主义者。
问卷初稿完成后,找到10名自愿参与的被试者进行预调查研究,并邀请了9名理解文化理论内涵并熟悉被试者的专家进行评审。最终的调查问卷经由这些人员把关后,又进行了调整和完善,以保证内容效度。
1.2   数据采集与清洗
(1)明确调查对象:本调查面向西部地区科技工作者,包括科研人员、技术人员、科技管理人员和科技辅助人员。
(2)问卷发放:本调查依托互联网站“问卷网”,以社交软件“微信”为主要媒介,于2019年5月和10月向中国科学院西部地区的单位进行了“群组式”推送。受委托的4位调查员按被调查单位的研究单元(10个部门)划分,分别选择推送对象;由被推送对象自行决定是否填写、提交,以及继续推送给谁;调查直到样本数据超过本调查所需期望样本数为止,期望样本数E根据研究对象职工人数(总样本规模,N=1000)的简单随机抽样要求进行确定。本调查期望样本数为88。
(3)问卷回收:回收机制设置了必须完成全部40道题的前置要求。调查前期,因为涉及伦理学与道德规范,予以可选的匿名提交选项(此致后期数据出现人口学变量未知的情况,后期调查获依托单位批准后则对人口学信息进行收集)。为保证调查问卷的有效性和代表性,对回收样本进一步限定:拒绝匿名非本区IP样本;拒绝同一IP或微信账号的重复提交;拒绝单一选项超过35个的。因此,在最终接收到的181份问卷中,剔除不符合要求的问卷21份,最终有效问卷为160份。
(4)数据清洗:在完成问卷结果统计和质量验证后,对收集的数据进行整理。首先将试题答案按等级主义为1、平等主义为2、个人主义为3及宿命论为4进行返回值规范化转译,所任岗位依次以1–4编码科研、技术、管理和辅助。同时删除被试者自愿提交的账号名称、IP地址及所在地等个人隐私信息,保留性别、年龄和工作岗位信息。如此形成本数据集。
2   数据样本描述
2.1   样本数据的人口统计特征
清洗后的样本数据集包含50列。第1列为序号。第2–5列为背景信息。其中,第2列为性别信息,1为男性,2为女性;第3列为年龄信息,以2019年为基准年可推算被试者的出生年份;第4列为岗位信息,1代表科研岗位,2为技术岗位,3为管理岗位,4是辅助岗位;第5列为问卷提交时间。第6–45列为40个问题的答案,1代表等级主义倾向,2代表平等主义倾向,3代表个人主义倾向,4代表宿命论倾向。第46列为等级主义倾向得分,第47列为平等主义倾向得分,第48列为个人主义倾向得分,第49列为宿命论倾向得分。第50列为判定的文化类型结果,1代表等级主义者,2代表平等主义者,3代表个人主义者,4代表宿命论者。
本调查工作所获得的160份有效样本数据中,所有样本的人口统计特征如表3所示(具体对应数据集的gender、age和position)。其中,自愿反馈性别、年龄及岗位的有126人,占比78.8%。这其中,被试者男性比例为57.9%,女性为42.1%,与中国科学院西部地区某研究单位整体的男女比例接近;31–50岁的人员占76.2%,即骨干力量占多数。因辅助人员大多从事技术支撑或行政管理,故已知岗位的被试群体中占比50.8%的科研人员抽样数稍微偏低。
表3   样本人口统计基本特征
序号基本特征实际统计样本数百分比
1性别

匿名
73
53
34
45.6%
33.1%
21.3%
2年龄30岁及以下
31–40岁
41–50岁
51–60岁
未知
30
60
30
6
34
18.7%
37.5%
18.8%
3.8%
21.2%
3岗位科研
技术
管理
辅助
未知
64
33
16
13
34
40.0%
20.6%
10.0%
8.1%
21.3%
4合计160100%
2.2   样本数据判定结果描述
本调查工作所获得的160份有效样本数据中,最终判定为等级主义者75人,平等主义者73人,个人主义者9人,宿命论者3人,整体占比情况如图2所示。可知,抽样调查所展示的结果为,中国科学院西部地区科技工作者中,等级主义者和平等主义者分别有47%和45%,个人主义者6%,宿命论者2%。其中,等级主义者集合内反馈性别者66人,男性为32人;平等主义者反馈性别者59人,男性为36人。如图3所示,性别导致的分异,在中国科学院西部地区科技工作者中,等级主义者不明显,个人主义者和平等主义者偏向男性,宿命论者偏向女性。自愿反馈年龄信息的科技工作者中,等级主义者和个人主义者的中位数年龄近40岁,平等主义者的中位数则在35岁,而宿命论者处于25–30岁之间,如图4所示。不同文化类型的年龄分布结果与以往文化理论大范围调查的结果有较大的出入。后者认为随着年龄增大,人们会倾向于转变为平等主义者和宿命论者,而个人主义者是年轻人的特征。这说明在西部地区从事科技工作可能会对个人的文化类型或生活方式造成影响。自愿反馈岗位信息并担任科学研究岗位的64人中,27人为等级主义者,32人为平等主义者,5人为个人主义者,无宿命论者;担任技术支撑岗位和辅助岗位的46人,23人为等级主义者,19人为平等主义者,如图5所示。接受调查的16名管理人员,9人为等级主义者,5人为平等主义者,1人为个人主义者,还有1人为宿命论者。从事行政管理工作岗位可能较大程度上影响个人的生活方式。整体上该单位从事科研和技术岗位人员个人主义者偏少,说明往后在新员工招聘过程中,有必要向个人主义者倾斜。


图2   样本数据集中不同文化类型的分布图


图3   样本数据中不同文化类型科技工作者的性别分异


图4   样本数据中不同文化类型科技工作者的年龄分异


图5   样本数据中不同文化类型科技工作者的岗位分异
3   数据质量控制与评估
3.1   质量控制
本数据集的质量控制通过收集前的问卷质量验证和数据回收过程质控两道程序保障。
(1)问卷质量验证
在完成调查问卷的初版开发后,邀请了10名被试者开展预测试工作。被试者中从事科研岗位的人员有6人,从事技术支撑岗位的3人,从事行政管理的1人。其中男性6名,女性4名。为能更好地在短时间接受文化理论进而自我评定,同时因为文化类型根据个人年龄的增长呈现变化趋势,故此次选择预测试被试者的年龄区间在31–40岁之间,且为在区域科技活动较为活跃者。
在10名预调查被试者完成问卷的填写后,由问卷开发者详细介绍文化理论关于4种生活方式(文化类型)的区分特征(如表1归纳)。在确保被试者已理解的提前下,给予10分钟时间由其自行判定各自的类型,汇总得到各自的结果。对该评定结果与问卷评定结果进行分析,绘制如表4所示的混乱矩阵,可以按照式(1)和式(2)计算一致性比率p0 和Kappa系数Kc (Cohen’s Kappa)。
\[{p}_{0}=\frac{m}{N}                                                                    (1)\]
式中m为匹配数,N为观察数。
\({K}_{\mathrm{c}}=\frac{{p}_{0}-{p}_{e}}{1-{p}_{e}}\) (2)
式中p0 是观察的一致性比率,pe 则是期望的一致性比例,由式(3)计算可得。
\[{p}_{e}={\sum }_{\begin{array}{c}i=1\\ j=1\end{array}}^{k}\frac{{n}_{ij}}{N}×\frac{{n}_{ji}}{N} , i\ne j                                                (3)\]
其中,nij 是指第i行第j列的频数。
表4   预测试被试者判定值与自评结果的混乱矩阵
序号判定为1判定为2判定为3判定为4
自评为13000
自评为21300
自评为30020
自评为40001
注:判定和自评类型1–4依次为等级主义者、平等主义者、个人主义者和宿命论者。
原则上还应进行评估的独立性检验,但预测试原本按照相互独立的方案进行设计,故此处的样本渐进方差计算省略。
另外,按照Kappa统计量判定准则,高于0.6即为高度的一致性强度,而高于0.8则为几乎完全一致。于是,按照式(1)和式(2)计算得到问卷判定类型和自评类型的一致性比率p0 为0.9,Kappa系数为0.861,可见本次开发的问卷具有高度的一致性。
在完成预测试后,还开展了专家评估工作。邀请了9名在一定程度上理解文化理论,同时又认识前述10名被试者的专家,组成一个专家判定小组,进而开展专家结合问卷对观察对象进行类型判定的一致性验证工作。其结果如表5所示。
表5   预调查被试者的专家判定结果
序号类型1类型2类型3类型4Pi
被试180100.778
被试245000.444
被试318000.778
被试436000.500
被试572000.611
被试610800.778
被试718000.778
被试880100.778
被试910800.778
被试1003060.500
Pj0.3780.3560.2000.067
根据上述专家判定结果与问卷判定的结果进行一致性分析,可得到整体观察的一致性比率p0 ’为0.800,Kc ’为0.713,表明具有高度的一致性。
为深入研究专家判定工作的一致性程度,此时利用一个更一般化的Kappa系数(Fleiss’ Kappa)作为一组评估人(比如m个专家,此处m=9)根据问卷题项,判定观察对象类型的一致性度量。换言之,即n个观察对象(也即被试,同时此处n=10)被m个专家独立分配到互斥的且无遗漏的s个名义分类(本调查中s=4)之中,m个专家的一致性程度。如此可分析基于问卷判定时,不同专家观察结果的一致性情况。
现约定nij 为第ii=1,2,…,n)个观察对象被判定为第jj=1,2,…,k)个名义的频数(判定数量),则有:
\[{\sum }_{j=1}^{k}{n}_{ij}=m                                                               (4)\]
若定义:
\[{P}_{j}=\frac{1}{nm}{\sum }_{i=1}^{n}{n}_{ij}                                                           (5)\]
Pj 即为观察中第j个分类所占的频次比例,即频率,见表5。
同时定义:
\[{P}_{i}=\frac{1}{m\left(m-1\right)}\left({\sum }_{j=1}^{k}{n}_{ij}^{2}-m\right)                                            (6)\]
Pi 为对于第i个观察对象m个评估人之间的一致性程度,解释为m个专家的“一致对”占所有可能组合对的比例,见表5。
如此根据专家判定的独立性,可计算n个观察对象接受专家基于问卷判定,总的一致性比率P0 为:
\[{P}_{0}=\frac{1}{n}{\sum }_{i=1}^{n}{P}_{i}=\frac{{\sum }_{i=1}^{n}\left({\sum }_{j=1}^{k}{n}_{ij}^{2}-m\right)}{n×m×\left(m-1\right)}                                                       (7)\]
进而根据式(2),可以得到专家判定的Kappa系数KF 计算如式(8):
\[{K}_{F}=\frac{{P}_{0}-{\sum }_{j=1}^{k}{P}_{j}^{2}}{1-{\sum }_{j=1}^{k}{P}_{j}^{2}}                                                          (8)\]
综上,分别根据式(7)和式(8)计算结果,得到问卷对照专家判定的一致率P0 为0.672,KF 为0.522,可见本次开发的问卷具有较好的一致性。
最后,问卷接受了预测试被试者和判定专家的修改意见和建议,进行了微调,使得言辞语义更加通俗易懂。
(2)回收数据质控
本次调查数据集的回收数据通过系统设置和人工处理两种方式开展质控。其中,依托网络平台限定的回收条件包括:完成全部40个问题的回答方可提交样本数据;同一IP地址不可重复提交。人工处理则主要进行单选项数目过高及非调查对象的问卷剔除。
3.2   数据评估
本次调查数据集质量评估采样整体评估和抽样评估相结合的方法。
由于本调查研究是定性研究,收集的数据为类型数据,而非具有连续性的量化变量,也即量表所得到的分值程度数据,故常规的效度检验其实并不适用。因此,采用内标验证的方法,对本问卷的效度进行校标验证。具体以调查问卷中第16题对人性看法的选择,对本次调查问卷的结构质量进行自验证,结果如表6所示。进而根据式(1)计算的数据集整体一致性比率为0.762,Kappa系数为0.623,表明具有良好的一致性。
表6   样本判定结果与问卷第16题答案的混乱矩阵
序号选项为1选项为2选项为3选项为4
判定为15011311
判定为226227
判定为31071
判定为40003
表7   样本判定结果与问卷第16题答案的抽样一致性结果
序号p0peKc
样本集10.80.470.623
样本集20.70.50.4
样本集30.90.450.818
样本集40.90.330.851
样本集50.70.440.643
平均值0.80.4380.667
方差0.0130.0040.033
同时,为验证数据统计随机性的作用,开展了局部抽样评估。从上述两组数据中随机抽取5组由10个样本组成的样本集,验证判定一致性如表7所示。平均的一致性比率与整体的值接近,为0.80。平均的一致性指数为0.667,也与整体的接近。两者都说明数据集有较好的一致性。
4   数据价值
通过从自然感知、社会认知、人际关系处理和自我反省等4个维度中的任意1–3个维度,对本调查所得到数据集数据进行对比验证,都无法得到使用全部4个维度数据的鉴定效果。因此目前来看,本调查设计的框架对中国科学院西部科技工作者的文化类型判定是综合且有效的。本文数据集为中国科学院西部地区某单位科技工作者的文化类型抽样调查情况,具有良好的一致性,可以反映西部地区该学科领域科技工作者的整体文化类型分布,可以直接用于解析西部地区该学科领域科技工作者从业态度的性别差异、年龄差异及其与担任岗位之间的关联研究。也可从文化因素的角度支撑科技评价工作相关研究的开展,为理解科技职业满意度研究、职业倦怠研究以及领导力研究提供一手的资料。如补充完善其他学科领域,或其他区域同领域科技工作者的文化类型分布,则可跨学科或跨区域进行横向对比分析。另外,对本数据集所提供的调查问卷进行相关问题的延伸,还可用于科技资源配置相关、科技创新成果产出评价及科技从业人员关键素质要求等研究领域。
5   数据使用方法和建议
本数据集数据文件为Excel格式。为完善研究,以及提升准确性,建议使用者补充样本量或针对性地重新调查。数据作者也将持续更新样本数据。
致 谢
感谢兰州资源环境科学大型仪器区域中心给予的全面支持。并感谢瞿珊珊、韩春坛、杨永如和陶明在数据采集阶段的建议和帮助,冯克庭、赵国辉为本文撰写提供的指导。
[1]
TURNER N J, GREGORY R, BROOKS C, et al. From invisibility to transparency: identifying the implications[J]. Ecology and Society, 2008, 13(2): 7.
[2]
COSTANZA R, D’ARGE R, DE GROOT R, et al. The value of the world’s ecosystem services and natural capital[J]. Nature, 1997, 387: 253-260.
[3]
Millennium Ecosystem Assessment, Ecosystems and Human Well-being: Synthesis[R]. Island Press, Washington D.C., 2005.
[4]
SATTERFIELD T, GREGORY R, KLAIN S, et al. Culture, intangibles and metrics in environmental management[J]. Journal of Environmental Management, 2013, 117: 103-114.
[5]
DOUGLAS M. Risk and Blame: Essays in Cultural Theory[M]. London: Routledge, 1994.
[6]
THOMPSON M, ELLIS R, WILDAVSKY A, et al. Cultural Theory (Political Cultures Series)[M]. Boulder, Colorado: Westview Press, 1990.
[7]
BURNER J. Acts of Meaning[M]. Cambridge, MA: Harvard University Press, 1990.
[8]
DAKE K. Orienting dispositions in the perception of risk: an analysis of contemporary world views and cultural biases[J]. Journal of Cross-Cultural Psychology, 1991, 22(1): 60-81.
[9]
DAKE K. Myths of Nature: cultural and social construction of risk[J]. Journal of Social Issues, 1992, 48(4): 21-37.
数据引用格式
王肖波, 徐中民, 赵雪茹. 中国科学院西部地区科技工作者的文化类型数据集[DB/OL]. Science Data Bank, 2019. (2019-08-26). DOI: 10.11922/sciencedb.858.
稿件与作者信息
论文引用格式
王肖波, 徐中民, 赵雪茹. 中国科学院西部地区科技工作者的文化类型数据集[J/OL]. 中国科学数据, 2021, 6(1). (2021-03-28). DOI: 10.11922/csdata.2019.0040.zh.
王肖波
Wang Xiaobo
主要承担工作:调查问卷的设计开发,数据采集与整理。
wangxiaobo@lzb.ac.cn
(1988—),男,浙江人,博士研究生,工程师,研究方向为人文地理。
徐中民
Xu Zhongmin
主要承担工作:调查问卷的验证和数据分析。
(1974—),男,湖南人,博士,研究员,研究方向为生态经济。
赵雪茹
Zhao Xueru
主要承担工作:调查问卷的数据前处理。
(1979—),女,甘肃人,硕士,工程师,研究方向为计算机应用。
出版历史
I区发布时间:2019年9月10日 ( 版本ZH1
II区出版时间:2021年3月31日 ( 版本ZH2
参考文献列表中查看
中国科学数据
csdata