发表时间:
论文状态:
论文类型:
栏目分类:
学科分类:

【科学大数据工程】发布时间:2019年7月17日 1259 6

野生动物携带病毒病原特色数据库

汤怡洁,李贝,周子健,等
关键词: 野生动物样本;病毒病原数据;新发传染病;跨种感染
doi:10.11922/csdata.2019.0018.zh

摘要:野生动物源性病毒的跨种感染是引起人类新发病毒性传染病的主要原因之一,系统收集整理野生动物样本以及病毒病原数据,建设野生动物携带病毒病原数据库显得尤为必要。本数据库通过建立的标准元数据描述规范,收集整理加工的野生动物样本和病毒数据达2万多条,数据覆盖多个国家以及中国多个省市地区,可以为从事野生动物病毒病原相关研究的国内外研究机构、高等学校提供服务。用户可根据自己的需求对野生动物物种、样品类型、...

【科学大数据工程】发布时间:2019年7月8日 1122 12

1999–2018年安全漏洞数据集

李瑞科,刘元,廖雷,等
关键词: 安全漏洞;漏洞数据集;数据采集;漏洞平台
doi:10.11922/csdata.2019.0026.zh

摘要:安全漏洞(Vulnerability)是信息系统在设计、实现或部署等过程中产生的缺陷。这些缺陷一旦被恶意主体所利用和进行攻击,就会对信息系统的安全造成损害,进而对用户、社会以及国家等造成重大损失。本研究通过程序自动化和人工采集结合的方法采集国内外知名漏洞平台1999–2018年间的安全漏洞数据,对采集的近20年的漏洞数据进行切片和格式化操作,保证数据可读性和一致性,从而构建完备的安全漏洞数据...

【科学大数据工程】发布时间:2019年6月24日 968 1

基于端点检测的蒙藏维语音片段数据集

韦向峰,袁毅,张全,等
关键词: 语音片段;端点检测;蒙古语;藏语;维吾尔语;语音数据
doi:10.11922/csdata.2019.0024.zh

摘要:在“中国少数民族地区蒙藏维言语录音2015数据集”的语音数据基础上,采用短时能量和短时过零率的双门限端点检测方法,得到一个句子语音的多个语音片段文件。本语音片段数据集包含蒙古语语音片段1751个、藏语语音片段711个、维吾尔语语音片段767个,数据总量大小约为112 MB。通过软件自动切分和语言专家的多重审核校对得到高质量的蒙藏维多语种的语音片段数据,可应用于少数民族的语音识别、端点检测、语...

【科学大数据工程】发布时间:2019年6月24日 600 8

1901–2014年黄土高原1 km分辨率月均温和月降水数据集

税军峰,任婧宇,彭守璋,等
关键词: 黄土高原;气温;降水量;Delta降尺度
doi:10.11922/csdata.2019.0017.zh

摘要:根据气候研究单位(CRU)发布的全球0.5°气候数据集以及中国生态系统研究网络(CNERN)发布的中国区高分辨率气候数据集,通过Delta空间降尺度方法在黄土高原地区降尺度生成本数据集。包括黄土高原地区月均温和月降水量,空间分辨率为0.0083333°(约1 km),时间为1901年1月–2014年12月。经地面观测数据验证表明,双线性插值法最适合黄土高原地区降尺度过程,Delta降尺度的气...

【科学大数据工程】发布时间:2019年5月27日 839 9

黄土高原地区500 m分辨率植被覆盖度数据集

曹晓萍,张琴琴,杨勤科,等
关键词: 黄土高原;植被覆盖度;NDVI
doi:10.11922/csdata.2019.0015.zh

摘要:黄土高原位于我国的生态敏感区,植被覆盖动态变化是该区域植被恢复和生态系统健康状况的重要指标。本数据集包含黄土高原2000年和2010年的逐月植被覆盖度数据,主要基于中国500 m归一化差分植被指数(Normalized Difference vegetation index,NDVI)旬合成产品通过投影、裁剪、合成月数据、像元二分模型计算等过程加工生成。该数据可反映黄土高原退耕还林前和退耕还...

【科学大数据工程】发布时间:2019年4月17日 4368 173

大田作物病害识别研究图像数据集

陈雷,袁媛
关键词: 农业病害;病害识别;标准图库;机器学习;训练样本
doi:10.11922/csdata.2019.0008.zh

摘要:根据联合国粮农组织报告,每年农业病虫害造成的自然损失率超过37%,农业病虫害识别与防治对于提高农业产量具有重要意义。传统人工识别方法依赖经验,主观因素较大,不够准确;近年来计算机视觉方法逐渐发展,该方法更加客观,并支持实时在线诊断,但需要大规模训练样本的支持,因此构建可供机器学习建模使用的图像数据集对于实现高效的农业病虫害识别至关重要。为此我们构建了农业病虫害研究图库IDADP,涵盖农业病虫...