数据论文 I 区论文(评审中) 版本 ZH2
下载
国际高温合金会议镍基高温合金数据集
A dataset of nickel base superalloys: Based on the International Symposium on Superalloy
 >>
: 2018 - 09 - 21
: 2018 - 11 - 23
: 2018 - 11 - 23
576 3 0
摘要&关键词
摘要:高温合金是制备飞机发动机叶片的材料,是推动国家航空航天发展的关键。国内高温合金发展存在瓶颈,然而国外高温合金数据保密性高,高温合金信息获取相对困难。国内高温合金数据的收集工作起步晚,且大部分关键数据都保存在企业中,不对外公开,导致开放共享的高温合金数据库较少,一定程度上制约了我国高温合金的研究。本数据集基于1980–2016年期间国际高温合金大会会议的论文集(International Symposium on Superalloys),采用人工阅读、像素点数值转化的方法,记录材料牌号与名称、材料成分、原材料信息、性能信息、实验条件等数据,从数据来源、数据审核人和数据误差率3个方面对数据质量进行控制和评价。并且,来自同一篇文章的数据拥有唯一的DOI标识。本数据集的研制对实现材料数据的知识产权保护与共享、对我国高温合金的发展都将起促进作用,同时满足了数据驱动的材料设计这一新型研究方式的需求。
关键词:高温合金;高温合金数据集;国际高温合金大会会议论文集;数据公开
Abstract & Keywords
Abstract: Superalloy is a crucial material for the development of aerospace industries. However, Due to high confidentiality imposed on superalloy data exchange abroad, acquisition of superalloy data has been relatively difficult. Domestic collection of superalloy data starts much later than and the databases are often not for open access, which to some extent restricts the development of superalloy research. Based on the International Symposium on Superalloys from 1980 to 2016, this study collects such information as materials grade and brand name, chemical composition, raw materials information, performance, processing and characterization conditions, by means of manual recording and pixel value conversion. Data quality is controlled and evaluated based on an examination of data source, data auditor and data error. And the data from the same article have a unique digital object identifier (DOI). Our building of this dataset is conducive to materials data sharing, intellectual property protection, and the development of nickel base superalloys in China, and it significantly meets the requirement of data-driven materials design.
Keywords: superalloy; superalloy dataset; International Symposium on Superalloys; data opening
数据库(集)基本信息简介
数据库(集)名称国际高温合金会议镍基高温合金数据集
数据作者尹海清、徐斌、姜雪、张聪、曲选辉
数据通信作者尹海清(hqyin@ustb.edu.cn)
数据时间范围1980–2016年
数据量约1.3万条/18.9 MB
数据格式*.xlsx
数据服务系统网址http://www.materdata.cn/search2.php?tty=875
基金项目国家重点研发计划(2016YFB0700503)
数据库(集)组成数据集展示为一个网页页面,但可以从后台形成一个Excel文件批量下载,数据集涉及粉末高温合金、变形高温合金和单晶高温合金,包含6个部分:材料牌号与名称、材料成分、原材料信息、性能信息、实验条件和检测条件。
Dataset Profile
TitleA dataset of nickel base superalloy: Based on the International Symposium on Superalloy
Data corresponding authorYin Haiqing (hqyin@ustb.edu.cn)
Data authorsYin Haiqing, Xu Bin, Jiang Xue, Zhang Cong, Qu Xuanhui...
Time range1980–2016
Data volumeAbout 13 thousand entries/18.9 MB
Data format*.xlsx
Data service system<http://www.materdata.cn/search2.php?tty=875>
Sources of fundingNational Key Research and Development Program of China (2016YFB0700503)
Dataset compositionThe dataset is displayed as a web page, but a file (Excel) can be downloaded from the background to bulk download. This dataset includes data of the three kinds of superalloys, that is, P/M superalloy, wrought superalloy and single crystal superalloy. It stores the following six categories of data: brand and name, chemical composition, raw material information, performance, processing and characterization conditions.
引 言
高温合金具有优异的高温强度、良好的抗氧化和抗热腐蚀性能、良好的疲劳性能和断裂韧性[1],是指在600℃以上的环境中能够应对复杂的应力环境,并且可以保持表面稳定性的合金,是飞机发动机、汽车发动机常用材料。高温合金分为铁基、镍基和钴基3类高温合金,其中由于镍具有FCC结构组织稳定,室温到高温不发生同素异性转变,500℃以下几乎不氧化,且合金化能力强,添加十余种元素无有害相的特点[2],因此是应用最为广泛的高温合金材料。镍基高温合金在650~1000℃范围内具有较高的强度和良好的抗氧化、抗燃气腐蚀能力[3],广泛应用于航天发动机及航空发动机涡轮盘。高温合金优异的力学性能是航空发动机稳定运行的保证,是推动航空事业发展的重点环节,因此研究镍基高温合金力学性能对于我国航天航空事业的发展具有重要意义[4]。自1956年第一炉高温合金试炼成功,迄今为止,我国高温合金的研究、生产和应用已经历了多年的发展历程。回顾多年的历史,我国的高温合金从无到有,从仿制到自主创新,合金的耐温性能从低到高,先进工艺得到了应用,新型材料得以开发,生产工艺不断改进且产品质量不断提高,并建立和完善了我国的高温合金体系,使我国航空、航天工业生产和发展所需的高温合金材料立足于国内,也为其他工业部门的发展提供了需要的高温材料[5]
然而,高温合金是国家重要军备资源,保密性极强,美国高温合金的生产企业主要有P&W、GE、Honeywell等,对高温合金数据的管理十分严格,公司内部数据库处于保密状态,因此高温合金数据的获取并不容易。高温合金数据方面,国外已有的涉及高温合金的数据库包括美国国家标准局材料性能数据库,此数据库部分关键数据收费;荷兰PETTER欧洲研究中心的高温材料数据库,数据开放且数据涉及范围为力学与热力学;日本金属研究所、日本金属学会建立的金属材料力学性能数据库与日本国家材料科学研究所建立的“材料数据平台”处于数据开放状态。欧美俄日等国家十分重视高温合金信息的保护,国外高温合金数据库依附于各个研究机构,并且有较高的保密性。国内高温合金数据库有材料科学数据共享网,材料基因工程专用数据库,但整体上高温合金数据库建设相对缓慢,对外公开的高温合金数据库较少,使得国家高温合金数据交流困难,一定程度制约高温合金发展。所以国内学者使用高温合金数据相对困难,资源获取相对困难。
因此,建立高温合金数据库对未来国家航空发展具有重要的意义。本数据集希望拓宽高温合金数据获取通道,加强领域人才数据交流,实现数据共享,推动高温合金研究发展,促进国家材料基因工程发展。
1   数据采集和处理方法
1.1   数据源
本文的数据采集自国际高温合金大会会议1980–2016年期间的论文集(International Symposium on Superalloys)。国际高温合金大会创立于1968年,每4年举行一次,是高温合金领域水平最高、影响力最大、历史最悠久的国际性学术大会。每次会议均在9月举行,由来自世界各地著名的科研院所与高校、发动机制造公司和高温合金生产公司等产学研用单位的代表们参加,被誉为高温合金界的“奥林匹克大会”[6]。国际高温合金大会论文研究范围包括铁基高温合金、镍基高温合金和钴基高温合金3类。而文章内容涉及铸造(定向结晶、单晶、多晶)高温合金工艺、变形高温合金工艺和粉末冶金高温合金工艺,并研究其蠕变性能、疲劳性能和腐蚀性能,还包括各元素对高温合金组织性能的影响等多个方面。其广泛的研究范围为数据的开拓应用提供保障。本研究以1980–2016年国际高温合金大会会议论文集作为数据采集对象,将论文集中镍基高温合金数据进行收集、整理,形成高温合金数据集。
1.2   数据内容规范
根据《材料科学数据统一描述规范的建立与应用[7]对材料科学数据建立与描述方式的规范,以及《材料科学数据提交格式规范》对材料科学数据收集、整理、提交做出的统一格式要求[8],确定镍基高温合金数据内容(表1),最终获得镍基高温合金数据集。镍基高温合金数据分为通用信息、材料牌号、材料名称、化学成分、原材料信息、性能信息、实验条件、数据生产与审核8个大模块。每个大模块下又会有各自的小模块,细化镍基高温合金数据的描述,全面提取文章中的可用信息,保证数据的完整性。然后按照镍基高温合金数据模板内容在文章中寻找可用模板数据并记录。
表1   镍基高温合金数据内容
模块子模块
通用信息创建时间、关键词、提交者、摘要信息、DOI、数据录入方式、模板名
材料牌号材料牌号
材料名称材料名称
化学成分成分、比例
原材料信息原材料名称、原材料性能、性能值、单位、生产方法、生产商、备注
性能信息性能类别、性能名称、性能值、单位、测试设备与型号、检测机构、性能相关图片、性能相关附件
实验条件条件名称、参数名、参数值、单位
数据生产与审核数据生产者、数据审核者、备注
1.3   数据采集与处理
文章中的数据分为3类。第1类是数字化数据,第2类是文本数据,第3类是图中数据。不同数据类型,其数据内容、数据所在位置和获取方法不同。表2列举了3种类型数据各自的数据内容范围,数据所在位置和数据获取方法。
表2   数据内容及其采集、处理方法
数据类型数据内容数据所在位置获取方法
数字化数据材料成分Experimental阅读摘录
原材料信息Experimental
性能信息Results
文本数据材料牌号Introduction阅读摘录
材料名称Introduction
实验条件Experimental
图中数据性能信息Results离散点图:像素点转化数值
拟合图:不处理
2   数据样本描述
2.1   数据样本
镍基高温合金数据模板通用信息、材料牌号、材料名称、化学成分、原材料信息、性能信息、实验条件、数据生产与审核8个大模块中,材料牌号、材料名称、化学成分、性能信息与实验条件5项是必填项,以此保证数据的完整性。
通用部分(图1)包括创建时间、关键词、提交者、摘要信息、DOI、数据录入方式、模板名,展示数据的基本生产信息。


图1   镍基高温合金数据样本——通用部分
材料牌号、材料名称(图2)两部分是该高温合金的常用名称。


图2   镍基高温合金数据样本——材料牌号、材料名称
化学成分(图3)是将高温合金的所有添加组元进行记录,并且每一种化学成分对应着其百分含量。


图3   镍基高温合金数据样本——化学成分
原材料信息(图4)主要展示原材的特性,包括原材的某些性能特性及其生产过程。但是一般来说,文章中相关记录不多。


图4   镍基高温合金数据样本——原材料信息
性能信息(图5)中性能类别、性能名称、性能值与单位一一对应,性能相关图片与性能相关附件关联的是文章中相关的材料组织图片与性能数据。


图5   镍基高温合金数据样本——性能信息
实验条件(图6)将文章中所描述的实验步骤全部记录下来,包括其制备过程与测试过程,实现全流程数据的记录。


图6   镍基高温合金数据样本——实验条件
数据生产与审核(图7)需要提交人记录摘录人员及其审核数据人员信息,并且要求审核人员具有一定业内知识水平,保证数据合理性。


图7   镍基高温合金数据样本——数据生产与审核
其他信息(图8)是数据的来源方式,按照国标GB/T7714记录所摘录的文章。


图8   镍基高温合金数据样本——其他信息
2.2   数据DOI标识
数字对象唯一标识符(Digital Object Identifier,简称DOI)是由美国出版协会(The Association of America Publishers,简称AAP)创建,由国际数字对象唯一标识符基金会(International DOI Foundation,简称IDF)负责运行的数字对象唯一标识符系统[9]。材料科学数据的DOI编码格式为:DOI:10.institution/classification.project.date.type.sequence。图9为DOI标识示例与内容描述。本数据集建立了材料数据的DOI标识,来自同一篇文章的数据拥有唯一的DOI标识,是数据集中对数据知识产权的描述,保证数据的知识产权不受侵害。


图9   数据DOI标识示例与内容描述
3   数据质量控制和评估
本数据从数据来源、数据审核人和数据误差率3个方面对数据质量进行控制和评价。
材料科学数据可以分为完全可靠、一般可靠和有待验证3类,其中完全可靠的数据指已公开发行的手册、标准、书籍等出版物的数据。本数据集的数据来源是国际高温合金大会会议论文集,其是高温合金领域的权威出版物,相比较一般出版论文,其数据可靠程度更高,一定程度上保证了本数据集的可靠性。
数据审核者要求是高温合金领域的知名学者或具有足够知识水平能力保证数据正确性的人员,以此保证数据质量。
本数据集采用人工方法从会议论文中获取数据。对于文中明确给出的数据内容,数字化数据进行完整摘录,所收集数据与原文数据一致。对于文章中图片给出的散点数据,采用人工抽选对照校验,随机抽取300条数据进行重新描点对照,获取数据误差率在3%以内。
由于数据来源于会议论文中,本数据集涉及范围仅限于该会议论文出现中的数据。除此之外,对于审核过程中发现的少数不符合高温合金常规认知的可疑数据,进行了人工删除。
4   数据价值
由于国外高温合金数据库对数据保密程度高,国内学者使用数据非常困难。因此,本数据集收集高温合金数据并对外公开,旨在突破数据信息交流的壁垒,使数据为高温合金领域的研究学者和设计人员所共享,充分发挥数据的使用价值。
本数据集涵盖整个材料的过程信息,使数据使用人员能够清晰地理解材料每一个步骤的变化。数据量约1.3万条数据,为大数据分析提供数据基础。使用神经网络、支持向量机、回归分析及多元线性回归等多种方法进行数学分析,可以为采用数据挖掘方法研究高温合金奠定坚实的数据基础。同时,采用大数据技术进行研究,契合材料基因工程的思想,有助于推动国家材料基因工程的发展。
同时,本工作独创性地应用DOI标识解决了材料数据的知识产权保护难题,对每一条数据和本数据集进行知识产权保护,明确数据的产出,使DOI成为推动数据共享的重要举措。
[1]
郭茂文, 刘春荣, 郑雪萍, 等. 粉末高温合金的研究现状[J]. 热加工工艺, 2017(20): 11-13.
[2]
陈国良. 高温合金学[M]. 冶金工业出版社, 1988.
[3]
黄乾尧, 李汉康. 高温合金[M]. 冶金工业出版社, 2000.
[4]
王会阳, 安云岐, 李承宇, 等. 镍基高温合金材料的研究进展[J]. 材料导报, 2011(s2): 482-486.
[5]
师昌绪, 仲增墉. 我国高温合金的发展与创新[J]. 金属学报, 2010, 46(11): 1281-1288.
[6]
材料国重. 中国培养的博士研究生首次在国际高温合金大会上获奖-北科大博士生们闪耀在国际高温合金界的学术舞台[EB/OL]. (2016–09–21) [2018–08–121]. http://news.ustb.edu.cn/xinwendaodu/2016-09-21/63890.html.
[7]
姜雪, 张聪, 张凯琦, 等. 材料科学数据统一描述规范的建立与应用[J]. 科研信息化技术与应用, 2017, 8(1): 35-44.
[8]
材料科学数据共享网. 材料科学数据统一描述规范[EB/OL]. (2018–04–01) [2018–08–12]. http://www.materdata.cn/view.php?id=220
[9]
材料科学数据共享网. 材料数据对象唯一标识符命名与注册规范[EB/OL]. (2018–04–01) [2018–08–12]. http://www.materdata.cn/view.php?id=195.
数据引用格式
尹海清, 徐斌, 姜雪, 等. 国际高温合金会议镍基高温合金数据集[DB/OL]. 材料科学数据共享网, 2018. DOI: 10.11961/mater0203.MGI.20171221.db.0055.
稿件与作者信息
论文引用格式
尹海清, 徐斌, 姜雪, 等. 国际高温合金会议镍基高温合金数据集[J/OL]. 中国科学数据, 2018. (2018-11-19). DOI: 10.11922/csdata.2018.0060.zh.
尹海清
Yin Haiqing
主要承担工作:数据库构建与数据管理。
hqyin@ustb.edu.cn
(1971—),女,黑龙江省齐齐哈尔市人,博士,教授,研究方向为材料学、数据库及数据挖掘。
徐斌
Xu Bin
主要承担工作:数据收集与处理。
(1994—),男,山东省淄博市人,硕士,研究方向为材料数据挖掘。
姜雪
Jiang Xue
主要承担工作:数据库的构建、维护与管理。
(1988—),女,辽宁省朝阳市人,硕士研究生,工程师,研究方向为材料基因工程数据库、数据挖掘与材料知识工程。
张聪
Zhang Cong
主要承担工作:数据收集。
(1989—),山东省济宁市人,博士,助理研究员,研究方向为热力学、动力学、合金设计。
张瑞杰
Zhang Ruijie
主要承担工作:数据收集。
(1977—),河南省郑州市人,博士,副教授,研究方向为材料相变过程模拟、集成计算材料工程。
刘国权
Liu Guoquan
主要承担工作:数据库构架设计。
(1952—),男,山东省乐陵市人,博士,教授,研究方向为相图研究及材料工艺与组织设计、材料过程计算机仿真。
曲选辉
Qu Xuanhui
主要承担工作:数据库构架设计。
(1960—),男,湖南省常德市人,博士,教授,研究方向为高性能金属材料、电子封装材料、粉末注射成形技术。
出版历史
I区发布时间:2018年11月23日 ( 版本ZH2
参考文献列表中查看
中国科学数据
csdata