欢迎访问中国科学数据!

科学数据出版调查与分析

暂无讨论

提交问题或建议:



您还没有登录,请[登录]或[ 注册]!

科学数据出版调查与分析

浏览下载总计

网页浏览 论文下载
3670 64

科学数据出版调查与分析

作者发表的论文

很抱歉,没有检索到作者相关论文!

            数据来源:CSCD中国科学引文数据库

科学数据出版调查与分析

黎建辉1*,吴超2,张丽丽1,李成赞1,胡良霖1

1. 中国科学院计算机网络信息中心,科学数据中心,北京  100190;

2. 伦敦帝国理工学院,数据科学研究院,伦敦  SW7 2AZ

*  通讯作者(Email: lijh@cnic.cn)

国家自然科学基金项目“面向管理和决策的大数据资源共享与治理机制”(No.91546125)

摘要:现代科学活动对数据的依赖日益增强,这使得推动科学数据开放共享逐渐成为现代科学研究的必然诉求。然而科学数据共享实践仍存在诸多障碍。为了更好地协调科学数据开放共享相关利益者的权益分配、减少数据开放的阻力,科学数据出版提供了一种积极的模式探索。立足现代科研活动背景,本文面向在ESSD、ESA、GBIF、DRYAD、PANGAEN等机构发表数据论文的上千名作者展开数据出版调查。本调查于2014年8月至12月进行,重点围绕数据出版动力、数据出版方式、数据出版运营模式以及数据出版质量评价展开。调查结果显示,数据出版作为推动科学数据共享的途径之一,已获得较广泛共识。当前数据出版发展初具规模并进入快速上升期。与传统出版相比,数据出版在树立学术地位和行业认可度等方面还有待提升。运营模式尚不成熟,数据权益保护、运营机制等仍是数据共享的关注焦点。数据引用评价源于传统学术体系又有所不同,亟待建立一套高效合理的质量控制与评价激励机制。

关键词:科学数据;科学数据出版;数据共享;调查统计

Survey and analysis of scientific data publishing

Li Jianhui, Wu Chao, Zhang Lili, Li Chengzan, Hu Lianglin

Abstract: Modern scientific activities tend to increasingly rely on data, which in a way makes data openness a prerequisite for current scientific research. Faced with obstacles in data sharing, data publication enables an exploratory approach to coordinating different stakeholders and reducing open data obstacles. The survey tries to understand these issues by investigating authors of data papers from units including Earth System Science Data (ESSD), Ecological Society of America (ESA), Global Biodiversity Information Facility (GBIF), Dryad Digital Repository (DRYAD) and Data Publisher for Earth & Environmental Science (PANGAEN). The survey was carried out during August and October 2014, with a focus on the motivation, form, operational model and quality evaluation of data publishing.Results show that data publication has gained wide recognition as an effective way of data sharing and it is currently at a rapid development stage. However, compared with traditional publications, its academic status, recognition and credibility still need to be improved. Results reveal some major concerns of data publishing including the immature operational model, data copyrights protection and compensation mechanism. Evaluation of data citation is derived yet differs from the traditional academic system, calling for the establishment of an effective and reasonable mechanism for incentive.    

Keywords: scientific data; scientific data publishing; data sharing; statistics

引  言

现代科研活动对数据的依赖性与日俱增。为保障学术质量,科学研究的重复实验既要求科研成果可回溯,又希望数据与分析过程可再现。开放科学数据能够促进科学体系自我纠错能力的提升,数据的广泛重用则能带动相关产业和经济的发展。

实际上,通过学术期刊出版学术论文作为科研成果主要评价依据的工作由来已久,大致可追溯至亨利·奥登伯格(Henry Oldenburg)1665年创立的《皇家学会哲学会刊》(《Philosophical Transactions of the Royal Society》)[1]。一篇完整的学术论文应该包括对实验的完整描述、结果数据、不确定性评价和确保数据能被验证和重复使用的元数据,但近30年来,实际情况却是原始数据和科学结果的割裂发表[2]。2009年一项针对生物医学领域影响力前50 名期刊的共计500 篇论文(从每种期刊中取10 篇文章)调查显示[3],只有47 篇文章(9%)在线存储了全部原始数据。笔者认为,开放数据共享的阻力来自于多方面:(1)科研激励机制问题;(2)知识产权问题;(3)国家安全、机密和隐私保护问题;(4)成本问题;(5)个体心理和组织文化问题;(6)技术和基础设施问题等等。

在此背景下,科学数据出版与引用提供了一种探索模式。科学数据出版通过对科学数据相关利益者权益的梳理,试图化解数据开放共享的诸多问题。所谓科学数据出版,是指科研人员与科研机构按照统一规范的质量管理和控制机制,主要利用互联网及其他方式公开发布其通过观察、实验、计算分析等科研过程所产生的原始数据(Raw data),或通过对已有数据进行系统化地收集、整理和再加工形成数据及数据产品(Data product)的出版行为,以帮助使用者便捷地发现、获取、理解和再分析利用数据,并可在科研论文及相关科研成果中引用数据。

数据出版并非新鲜事物,数据作为期刊专栏、附录等形式专门出版的情形在很多自然科学刊物中早有实践。按照出版形态,数据出版可分为独立数据出版(Standalone Data Publication)、学术论文辅助数据出版(Data Publication by Proxy)、附录数据出版(Appendix Data)、期刊数据档案出版(Journal Driven Data Archival)以及数据论文出版(Overlay publication)等五类[4]

数据出版实践主要集中在出版社和国际组织等机构。例如,《地学系统科学数据》(Earth System Science Data,ESSD)于2008年起出版地球系统科学数据,以维护科学数据资源的可信度,同时通过数据论文的文献计量学探索,极力提升数据论文作者的学术影响力。《自然》(《Nature》)自2014年起开始出版数据论文,并提供相关数据的机构库存储与访问服务支持。《生态档案》(《Ecological Archives》)发布美国生态学会期刊文章的补充材料,如刊登《生态》(《Ecology》)中已发表的经同行评议的数据论文。在我国,《中国科学数据》、“全球变化科学研究数据注册与出版系统”等,也进行了数据出版方面的实践。

那么科学家究竟如何看待数据出版呢?数据出版的动力来源与所采取的出版方式如何?数据出版的运营模式是否具有可持续性?出版形态的数据质量如何把控?以下即对本专题调查的相关分析。

1  调查设计

1.1  调查对象

本调研的前提假设是,已发表数据论文的作者对于数据出版工作具有较高认知度。调查于2014年8月至12月进行,主要面向ESSD,美国《生态学》(Ecology Society of America,ESA),“全球生物多样性机构”(Global Biodiversity Information faculty,GBIF),国际数据仓储库(DRYAD),地球和环境科学数据出版信息系统(PANGAEN)等出版机构或相关组织投放,重点围绕2014年5月及以前在上述期刊或机构正式出版数据论文的作者群展开调查。

1.2  问卷设计与数据回收

本调查围绕数据出版话题,侧重从数据出版动力、数据出版方式、数据出版运营模式以及数据出版质量评价四大维度展开。问卷由50项具体问题组成。通过探讨数据出版的意义、价值及其操作层面的诸多问题,以期较全面了解数据出版发展现状,并试图探索推进数据出版事业未来发展、促进科学数据交流共享的可行之策。

调查问卷设计初稿定向邀请科学研究领域的4名专业人员测试填写,并通过他们的反馈意见,对问卷中指向不明、表述不清或有遗漏的地方予以指正。然后综合上述意见,修改完成问卷定稿(详见附录)。

问卷调查的发放采取在线方式进行,以电子邮件的方式向上述机构已发表数据论文的1575名作者推送指定调查问卷链接,邀请受访者在线填写并提交调查问卷。问卷发放过程中,无效地址或者拒收邮件270份,成功发送1305份,实际收回问卷147份。为了保障问卷回收数据的质量,特别进行了以下条件筛选:(1)问卷中含有未作答选项者,视为无效;(2)问卷中50道题目皆为同一选项者,视为无效。剔除全部无效问卷后,获得完整有效问卷共计129份,作为本文分析的统计数据基础。

2  调查结果分析

该项问卷调查主要维度包括数据出版动力、数据出版方式、数据出版运营模式以及数据出版的质量评价。囿于篇幅,笔者仅选取了问卷中的部分题目,并根据需要进行了一定的聚类重排和内容精简,详细内容可依问题编号索引至附录信息中查看。

2.1  数据出版动力

首先,在科学数据共享意愿方面,如图1所示,高达89%的受访者表示乐于分享科学数据促其发现更重要的成果(Q1)。更进一步的调查显示,对于所获数据和结果,仅有29%的受访者表示乐于立即分享,同时近2/3的受众则表示留待自用或暂不确定(图2,Q2)。科学研究驱动数据生产,同时数据拥有者更希望自己优先获得这些数据背后的科研价值而非立即分享。

如表1统计所示,有关科学数据出版动力的进一步研究表明,仅有不足一半受访者认同学术声誉在数据出版工作中的推动作用(Q3)。而在数据引用方面(Q4),仅31%的受访者对已发表数据的引用量表示满意;另有25%的受访者表示并不确定,这意味着数据论文作者对于“令人满意的数据引用量”的标准尚未达成共识。与图1所示的科学数据共享意愿相呼应,受访人群中压倒性多数(89%)积极表示将继续出版数据(Q7),折射出数据出版广阔的发展前景。

科学数据出版动力

尽管受访者对于数据出版的未来抱有积极乐观态度,但仅有半数人认为数据出版物和传统科研论文学术意义等同(Q5)。与此同时,赞同数据期刊出版者可以从传统科学共同体中同样获得较高声誉的比例略微下降至45%(Q8)。有意思的是,51%的受访者认为数据出版物的形式更能体现数据价值(Q14)。略过半数的支持率在一定程度上肯定了数据期刊的魅力,但同时也反映出数据期刊尚处于发展上升期的现实阶段性。

2.2  数据出版方式

那么,大家期望的数据出版形态到底是什么样子呢?如表2统计所示,发布渠道方面,多数受访者倾向选择正式出版物(Q9)。表现形式上,独立数据期刊、学术期刊附录以及学术期刊的科学数据专题等多样形式的需求并存(Q22)。笔者认为,多样化的出版形式,可满足不同相关利益者的数据共享诉求。考虑到科学数据的共同特征,无需纸质出版(Q15)以及需要公共集中存储数据(Q18)的观点都获得了大多数受访者的支持。而在数据出版的学科选择偏好方面,调查显示,不管是单一学科的数据发布还是跨学科的数据共享,都拥有一定的支持受众(Q23)。数据分发方面,不同学科领域多元化的数据用途使原始数据发布与API接口开放等形式都获得支持(Q10)。静态数据集因更容易按照传统出版模式运作而获得超半数支持,不过数据对象独有的动态性特征也给相当一部分受访者带来了出版方面的困惑(Q20)。

此外,唯一标识符(Q17)、元数据与描述文档(Q19)以及数据生产过程描述(Q21)等要素,作为数据出版物的重要组成部分,都获得了较高认可度。

2  数据出版形态调查结果

在数据出版的认定标准方面,针对现有数据集内容的增补(包括增加数据源、新的数据属性以及数据清洗工作等)是否可以被认定为新的数据产品而出版,50%受访者表示肯定,另有41%表示不确定(Q6)。笔者认为,观点差异是因为丰富现有数据集的贡献程度将决定其是否可被认定为新的数据出版物,但量化判断标准尚未达成一致。关于适合出版的数据规模的讨论中,受访者中57%赞成特定时间范围内“小数据集”的出版(Q45)。笔者推测,“小数据集”出版的较高支持率意味着受访者对于出版数据完整性定义的宽容,而这种宽容性则主要来自“小数据集”应用价值的存在。

那么现有方式的数据出版是否具有合适的工具支持呢?34%的受访者认为现有的搜索引擎(如谷歌学术搜索)即可满足查找数据出版物所需,同时持否定和不确定观点的各占约1/3(Q12)。这从一个侧面体现出数据搜索对查找工具与访问渠道的多元化需求。此外, 53%受访者表示,现有工具即可满足数据出版需要(Q16),例如NATURE、ESSD、DRYAD、FIGSHARE等在线数据出版平台均提供开放的数据发布渠道和标准规范工具等。由此观之,数据出版支持工具建设,不再是当前阻碍数据出版发展的重要因素。

此外,在数据出版工作的时间成本调查上,67%的受访者认为,数据出版物与其他出版物的时间耗费成本相仿(Q11);76%的受访者表示数据出版前的数据预处理工作较为耗时(Q13)。笔者认为,数据出版的时间花费总体上与数据的自然属性和利用导向密切相关,这与传统出版并无明显出入,但在出版耗时的具体构成方面受制于数据属性而与传统出版有所区别。

2.3  数据出版运营模式

成熟的数据出版产业离不开合理的运营模式支撑。受访者中有72%支持数据消费者免费使用科研数据(Q27),同时有高达87%的受访者认为数据出版适合开源模式(Q31)。这表明,受访者对免费获取、使用科学数据具有较高期望。那么不同的数据用途是否都可以享用免费午餐呢?调查显示,在面向科研用途的数据分享方面,高达93%的受访者明确表示应免费提供(Q28)。而公共开放利用方面,支持率则下滑至75%(Q29)。不难判断,支持率的下降缘于不同用途的获利差别。免费开放的呼声和利用顾虑说明,数据共享的运营模式尚不成熟,仍是一个值得深入探索的话题。

与此同时,政府部门应该如何定位呢?调查结果十分有趣,支持政府为数据获取付费及其反对意见比例相当,各占42%(Q30)。而在数据出版费用是否可纳入科研经费资助范围的探讨中,也许囿于相关实践匮乏,赞同观点占45%,同时有40%的受访者表示暂不确定(Q24)。

进一步针对数据出版费用的调查结果显示,绝大部分人对于数据出版费用是否合理(图3,Q25)以及定价是否可以承受(图4,Q26)等方面态度模糊。笔者认为,在独立数据期刊尚属少数的情况下,收取数据出版费用尚属少见,其中一些已经开始收取的数据出版费用,或参照传统科研刊物定价或暂时减免,所以受访人群可能尚无足够的经验体会。

除了经济利益,与数据出版运营模式密切相关的还包括版权归属问题。受访者中有75%表示作者应当拥有数据的版权(Q33),相较而言仅有4%赞成出版商应当拥有数据版权(Q32)。此外,科学家和数据生产者的权益关系方面,当科学家使用了数据生产者的数据并发表论文时(Q35),仅17%的受访者支持将数据生产者纳入发表论文的联合作者名单;44%反对以及39%表示不确定。笔者认为,数据生产者能否作为研究论文联合作者,需要视数据生产者对该研究论文的贡献程度而定。

2.4  数据出版质量

在数据出版的引用评价方面,压倒性多数受访者(96%)认为发表研究论文应对所使用的他人数据进行必要的数据引用(Q34)。而当问及现有评价与索引系统在数据出版中的适用性时,积极肯定的观点仅为19%(Q36)和24%(Q37)。

那么如何评价出版数据的质量呢?受访人群中大多数(66%)倾向采用同行评议的方式来控制数据质量(Q38),即传统方法对于专业性较强的数据质量控制仍具有一定的适用性。而对于时下较为流行的大众评议方式的选择上,则存在颇多分歧(Q29,32%赞同,36%反对,其余为不确定)。笔者分析,顾虑主要集中在所评议数据的学科领域与受众的匹配度上。如果是社会广泛熟悉的数据集,大众评议自然会带来丰富的评价内容;而对于应用冷僻的专业数据,则有可能存在难于寻找大众评议用户或评价样本量过低难于做出较公允评价的可能。

此外,数据引用是数据出版中关注度较高的话题。本次调查显示,有高达93%的受访人群认为数据引用量低并不能证明数据的价值小(Q40),另有60%则认为高引用率不意味着高价值(Q44),即数据引用量与数据价值并不完全相关。那么究竟什么是影响数据引用量的因素呢?如表3所示,热点话题数据以及数据的易用性等等都会使数据获得较高的引用量,而获取性困难却并不能明显提升数据引用量。由此可见,有利于数据用户使用的影响因素才有可能提升相关数据集的引用量。

数据引用量的影响因素

在有关数据出版的其他调研信息中(表4),出版数据的可验证性仅获得28%的支持率(Q46)。可见当前数据出版仍存在数据完整性不足、数据生产过程描述不清等导致数据重复试验条件不足的情况。尽管数据造假(Q47)或者剽窃(Q49)在数据出版中都变得更为困难,但出版数据的可信性(Q48)尚未赢得大部分人的支持,值得思考。

4  其他数据出版问题

3  总结与开放讨论

综上,该项调查展示了科学数据出版的业界实践进展。作为一类数据共享新探索,科学数据出版先天地与科学数据的特征紧密相连,在继承传统出版业工作模式的同时,又存在诸多特色。数据出版为科学数据开放共享提供了新的方法,同时也存在一些不足和值得深入探讨的内容。

3.1  主要结论

1. 数据出版作为推动科学数据共享的有效途径之一,已经获得越来越多的支持,拥有积极的发展空间和前景。绝大部分科研工作者有积极的数据分享意愿,同时也呼吁数据分享应包括与之适应的权益保障措施。

2. 数据出版配套工具的发展初具规模,并获得较广泛认同。

3. 与传统出版相比较,数据出版作为后起之秀,在树立其学术地位和行业认可度等方面有待提升。

4. 数据出版运营模式尚不成熟,开放数据共享的权益保护以及运营成本补偿机制等仍是制约数据共享持续发展的焦点。

5. 数据的引用评价源于传统学术体系,又有所不同,因此亟待建立一套既和科研活动接轨,又能适应自身发展的评价激励与质量控制机制。

3.2  研究局限性

本调查中的问卷设计与投放仍存在一定的客观局限性,这主要表现为:

其一,研究的前提假设是,公开发表过数据论文的研究人员对于科学数据出版具有一定的认知经验。但调查结果表明,受访者对于数据出版形态及其内容仍存在较大争议或认知不清楚、不确定的情况。

其二,受制于时间与调研条件等,回收问卷的体量尚显不足,且对投放目标与回收样本的细类未做进一步区分,致使统计结果可能存在偏颇。

其三,个别调研问题存在歧义,致使部分数据难于分析处理。

以上问题或局限性的存在,在一定程度上为科学数据出版后续调查与研究工作提供了契机。笔者将总结经验,在后续调研中增加与受访者的互动性交流,以期望更大样本量的回收与利用,以及相关方面的继续完善。

3.3  未来研究方向

通过上述调查统计分析,笔者认为,未来的科学数据出版仍有以下值得关注的重要问题:

1. 学术地位方面,如何评价“科学数据”在科学研究活动中的作用、地位及其贡献值大小。

2. 运行管理方面:1)如何运用现有技术,设计构建符合未来科研范式所需的出版形态,包括合理的展示方式、互动评价机制及出版前沿实践的应用等。2)科学数据出版的可持续发展利益机制的设计与运行操作,即如何协调科学数据出版相关利益者权益,保障科学数据出版活动的可持续性等。3)数据论文的引用评价机制体系的构建与运行。

3. 职业分工方面,在未来的科学研究活动中,数据加工是否将正式纳入科学研究体系,作为一项体面的、独立的细化分工职业而广泛存在。

4. 发展预期方面,科学数据出版是否会成为未来推动数据开放共享的主流模式抑或被新的开放共享模式所取代,尚需时间来揭晓。

致  谢

调查问卷的投放与收集得到ESSD、ESA、GBIF、DRYAD、PANGAEN等组织机构的大力支持以及伦敦帝国理工学院数据科学研究院的帮助。在此对上述参与单位和协助人员,一并表示感谢。

参考文献

[1]  Shapin S. A social history of truth: civility and science in seventeenth-century England[M]. Chicago: University of Chicago Press, 1994.

[2]  Boulton G, Campbell P, Collins B, et al. Science as an open enterprise[R]. London: The Royal Society, 2012.

[3] Alsheikh-Ali AA, Qureshi W, Al-Mallah MH, et al. Public availability of published research data in high-impact journals[J]. PLOS ONE, 2011(6). DOI: 10.1371/journal.pone.0024357.

[4] Lawrence B, Jones C, Matthews B, et al. Citation and peer review of data: moving towards formal data publication[J]. The international journal of digital curation, 2011, 2(6): 4~37.

引用数据

(1)  黎建辉, 吴超, 李成赞, 张丽丽, 胡良霖. 科学数据出版调查[DB/OL]. Science Data Bank. DOI: 10.11922/ sciencedb.840.87.

附录A  调查问卷

问题编号

主题

问题

答案选项

1

Motivation

(动力)

Would you like to share your scientific data with other researchers who might discover more significant results than you?(你是否愿意与其他研究人员分享数据,促其发现更重要的成果?)

Yes; No; Not sure

2

When you get some data or experimental results, would share it in the first instance, or withhold it for your own research?(当你获得数据或实验结果,你会立刻分享还是留待自用?)

Share it; Withhold it; Not sure

3

Do you think academic reputation drives people to publish their data?(你是否认为学术声誉是数据出版的驱动力?)

Yes; No; Not sure

4

Are you satisfied with the current number of citations for your published data?(你对自己已发表数据的引用量是否满意?)

Yes; No; Not sure

5

Do you believe that data publications could also be as academically rewarding as the traditional research paper?(你是否认为,数据出版和传统论文一样有学术意义?)

Yes; No; Not sure

6

If someone enriches an existing data publication (fuses with other data sources, adds new attributes, cleans data, etc.), should it be a considered new publication?(你是否认为,对原数据出版的丰富化﹝如添加新数据源、增加数据属性、清洗数据等﹞应被认定为新的数据出版?)

Yes; No; Not sure

7

Will you publish data again in the future?(你将来是否会再次出版数据?)

Yes; No; Not sure

8

Do you believe data journal publishers will build high reputations within academic community?(你是否认为,数据期刊出版者能在科研共同体中获得较高声誉?)

Yes; No; Not sure

9

Means

(方式)

Do you prefer to publish data in formal (academic) journals specific for data publication, or informal ways like on a self-managed website?(你倾向于将数据出版于正式﹝学术﹞期刊,还是非正式方式如自我管理的网站?)

Formal journals; Informal ways; Not sure

10

Is the data better published as raw data or through web services (API)?(原始数据与网络服务﹝API﹞两种形式,哪种更适合数据出版?)

Raw data; Web services; Not sure

11

Does authoring a data publication take more time than other kinds of publication?(与其他种类的出版物相比,出版数据是否需花费你更多时间?)

Yes; No; Not sure

12

Do you feel current scientific research engines, such as Google Scholar, can find your desired data publication?(你是否认为,现有科研搜索引擎﹝如谷歌学术﹞可以帮助你发现想要的数据出版物?)

Yes; No; Not sure

13

Do you believe it is time-consuming to pre-process data before publishing?(你是否认为,数据出版前的数据处理过程较为耗时?)

Yes; No; Not sure

14

Do you believe the value of data could be more appreciated in data publication than in ordinary scientific publication?(你是否相信,数据发表于专门的数据出版物比普通科学出版物更有价值?)

Yes; No; Not sure

15

Do you think it is necessary for data publications to also have hard copies?(你认为数据出版物是否同时需要印刷版?)

Yes; No; Not sure

16

Do you feel that we already have necessary tools for creating data publications?(你认为我们是否已具备必要的数据出版工具?)

Yes; No; Not sure

17

Do you think all published data must have persistent identifier, for example DOI (Digital Object Identifier)?(你是否认为,所有出版的数据须拥有永久标识符,如数字对象唯一标识符DOI?)

Yes; No; Not sure

18

Do you think all published data must be preserved in a public and centralized repository?(你是否认为,所有出版数据必须存储于公开集中的存储库?)

Yes; No; Not sure

19

Do you think that all published data should have metadata and its description documented?(你是否认为,所有出版的数据都应该有元数据及相关描述?)

Yes; No; Not sure

20

Which kind of data is more suitable for data publication: stable datasets, or dynamic data flow?(哪种类型的数据更适合数据出版:静态数据集还是动态数据流?)

Stable datasets; Dynamic data flow; Not sure

21

Should the process of generating data (cleaning, acquisition, integration, etc.) also be included in a data publication?(数据出版物是否应包括生产数据的过程﹝如清洗、获取、整合等﹞?)

Yes; No; Not sure

22

Do you believe that a standalone data journal is more significant than traditional research journals publishing data as supplement, or publishing data paper as special issue?(你是否认为,专门的数据期刊比以附录或专刊形式出版数据的传统期刊更为重要?)

Yes; No; Not sure

23

Do you think data journals should be specific to individual disciplines or cross-disciplinary?(你认为数据期刊应该专注某一学科领域还是跨领域?)

Individual disciplines;

Cross-disciplinary;

Not sure

24

Model

(模式)

Could the DPC be included as a part of your scientific funding?(数据出版费用是否应纳入科研经费资助范围?)

Yes; No; Not sure

25

Is the current DPC (Data Publishing Charge) reasonable?(现有的数据出版费用是否合理?)

Yes; No; Not sure

26

Is the current DPC affordable?(现有的数据出版费用是否可承担?)

Yes; No; Not sure

27

Do you agree that the use of scientific data should incur a cost to the consumer?(你是否赞同向科学数据使用者收费?)

Yes; No; Not sure

28

Should published data be free for academic use?(出版的数据是否应免费用于科研用途?)

Yes; No; Not sure

29

Should the published data be free for public (open) use?(出版的数据是否应向公众免费开放?)

Yes; No; Not sure

30

Do you believe that government organizations should pay for the cost of data access?(你认为数据获取是否应由政府机构付费?)

Yes; No; Not sure

31

Do you think it is better for data to be published as open source/open access (users don’t need to pay to access it)?(你是否认为数据出版更适合开源模式?)

Yes; No; Not sure

32

Is it more appropriate for data publishers (e.g. IEEE) to own the copyrights (the right to charge the user of data) to data publications?(数据出版商﹝如IEEE﹞是否应拥有其数据出版物的版权?)

Yes; No; Not sure

33

Is it more appropriate for data authors to hold the copyright of their data publications, such as in PlosOne?(数据作者拥有其出版数据的版权是否更为合适,如PlosOne?)

Yes; No; Not sure

34

Do you believe that scientists should cite others’ data that they use when publishing their own research papers?(你是否认为科学家在发表论文时应对所使用的他人数据进行引用?)

Yes; No; Not sure

35

Do you think when scientists use some data in their publications that they should include the data producers as co-authors?(你是否认为,科学家在其论文中使用他人数据时,应将数据生产者纳为共同作者?)

Yes; No; Not sure

36

Quality

(质量)

Do you feel current reputation systems, such as impact factor, are suitable for data publications?(你是否认为现有信誉评价体系﹝如影响因子﹞也适合于数据出版物?)

Yes; No; Not sure

37

Do you feel current indexing systems, such as SCI, are suitable for data publications?(你是否认为现有索引﹝如SCI﹞适用于数据出版物?)

Yes; No; Not sure

38

Do you believe it is fair to qualify data by peer review?(你认为通过同行评议来控制数据质量是否合理?)

Yes; No; Not sure

39

Do you believe it is fair to qualify the data with ‘crowd rating’ (community endorsements)?(你认为通过大众评议来控制数据质量是否合理?)

Yes; No; Not sure

40

Do you believe data publications with a low citation count are useless?(你是否认为数据出版物引用量越低,价值越低?)

Yes; No; Not sure

41

Do you think some data is highly cited because it is more difficult to acquire?(你是否认为一些数据的高引用量缘于其获取困难?)

Yes; No; Not sure

42

Do you think some data is highly cited because it is about a popular topic?(你是否认为一些数据的高引用量缘于它属热门话题?)

Yes; No; Not sure

43

Do you think some data is highly cited because it is easier to understand and use than other data?(你是否认为一些数据的高引用量是由于它比其他数据更易理解使用?)

Yes; No; Not sure

44

Do you believe that data should be perceived as being more valuable if it is cited more often than other data?(你是否认为数据引用量越高越有价值?)

Yes; No; Not sure

45

Is it appropriate to publish partial results (e.g. data gathered only within a particular time period) as a data publication?(将部分结果作为数据出版物发表是否得当﹝如特定时间范围的数据﹞?)

Yes; No; Not sure

46

Do you agree that all the data published is verifiable?(你是否认为所有出版的数据都是可验证的?)

Yes; No; Not sure

47

Do you believe falsifying data and results is a current problem in data publications?(你是否认为数据和结果造假是数据出版物当前存在的一个问题?)

Yes; No; Not sure

48

For you, is it easy to judge the trustworthiness of a published data?(对你而言,判断已出版数据的可信度是否容易?)

Yes; No; Not sure

49

Do you believe plagiarism is a problem in data publications?(你是否认为抄袭是数据出版的一个问题?)

Yes; No; Not sure

50

When you use data from others, do you prefer to use the datasets that have been peer-reviewed rather than those that have not been peer-reviewed?(当你使用他人数据时,你是否更倾向使用经过同行评议的数据集?)

Yes; No; Not sure

 

引文格式:黎建辉, 吴超, 张丽丽, 李成赞, 胡良霖. 科学数据出版调查与分析[J/OL]. 中国科学数据, 2016, 1(1). http://www.csdata.org/paperView?id=9. DOI: 10.11922/csdata.120.2015.0009.

下载