摘要:在“中国少数民族地区蒙藏维言语录音2015数据集”的语音数据基础上,采用短时能量和短时过零率的双门限端点检测方法,得到一个句子语音的多个语音片段文件。本语音片段数据集包含蒙古语语音片段1657个、藏语语音片段666个、维吾尔语语音片段756个,数据总量大小约为111 MB。通过软件自动切分和语言专家的多重审核校对得到高质量的蒙藏维多语种的语音片段数据,可应用于少数民族的语音识别、端点检测、语音增强、语音合成和语言教学等领域。
关键词:语音片段;端点检测;蒙古语;藏语;维吾尔语;语音数据
数据库(集)名称 | 基于端点检测的蒙藏维语音片段数据集 |
数据作者 | 韦向峰、袁毅、张全、吐尔逊·卡得 |
数据通信作者 | 韦向峰(wxf@mail.ioa.ac.cn) |
数据时间范围 | 2015年 |
地理区域 | 中国内蒙古、青海、西藏、新疆 |
数据量 | 111 MB |
数据格式 | *.mp3 |
数据服务系统网址 | http://www.sciencedb.cn/dataSet/handle/788 |
基金项目 | 中国科学院信息化专项科学大数据工程(一期),多民族语言资源特色数据库,XXH13505-03-203;中国科学技术信息研究所富媒体数字出版内容组织与知识服务重点实验室开放基金项目,面向语音与文本内容的富媒体关联研究与技术实现;国家社科基金项目,维吾尔语方言语音声学参数库研制,13BYY34。 |
数据集组成 | 数据集分为蒙古语、藏语、维吾尔语3个语种,分别保存到meng、zang、wei 3个目录,每个目录包含相应语种的语音片段文件,蒙古语语音片段1657个、藏语语音片段666个、维吾尔语语音片段756个。 |
Title | A dataset of Mongolian, Tibetan and Uyghur speech fragments based on voice activity detection |
Data corresponding author | Wei Xiangfeng (wxf@mail.ioa.ac.cn) |
Data authors | Wei Xiangfeng, Yuan Yi, Zhang Quan, Tursun Kadir |
Time range | 2015 |
Geographical scope | Inner Mongolia, Qinghai, Tibet and Xinjiang in China |
Data volume | 112 MB |
Data format | *.mp3 |
Data service system | <http://www.sciencedb.cn/dataSet/handle/788> |
Sources of funding | Multi-Layer Multi-Lingual Resource Characteristic Database,Scientific Big Data Project (Phase I), Special Project for Informatization in Chinese Academy of Sciences, XXH13505-03-203; Research and Technical Implement on Rich Media Linkage between Speech and Text, Open Fund Project of Key Laboratory of Rich Media Digital Publishing Content Organization and Knowledge Service, Institute of Scientific and Technical Information of China; Research and Development of Acoustic Parameter Database of Uygur Dialect, National Social Science Fund Project, 13BYY34. |
Dataset composition | The dataset is divided into three languages: Mongolian, Tibetan and Uygur, which are saved to three directories: meng, zang and wei. Each directory contains speech fragment files of corresponding languages, including 1657 Mongolian speech fragments, 666 Tibetan speech fragments and 756 Uygur speech fragments. |