汉维可比语料数据集

作者:冯韬,李淼,曹宜超,等
出版时间:2020年2月21日

语料库的构建是自然语言处理领域的重要工作。但是,双语平行语料库的规模和领域并不能满足实际的需求,尤其是在维吾尔语信息处理中表现得更加明显。因此,从互联网上挖掘汉维双语资源的工作,对于汉维双语资源的建设、促进民族之间的交流具有十分重要的作用。本文针对维吾尔语复杂多变以及汉维语言形态差异大等特点,研究并设计了汉维可比语料挖掘系统。本系统主要包括汉维网页正文抽取,汉维可比语料候选获取以及跨语言相似度计算等几个部分。目...

转发:第一届“ScienceDB科学数据奖”评选通知
致ScienceDB的广大用户:   ScienceDB从2015年初创到2019年2.0版本正式上线,已经走过了5年时光。我们每取得一点进步,都离不开各位科学数据工作者的默默坚守和大力支持。值此2020到来之际,为表彰在科学数据共享及出版方面具有突出贡献的科研工作者及团队集体,ScienceDB正式启动第一届“Sc ...
播放次数:683 阅读本文
转发:第一届“ScienceDB科学数据奖”评选通知
致ScienceDB的广大用户:   ScienceDB从2015年初创到2019年2.0版本正式上线,已经走过了5年时光。我们每取得一点进步,都离不开各位科学数据工作者的默默坚守和大力支持。值此2020到来之际,为表彰在科学数据共享及出版方面具有突出贡献的科研工作者及团队集体,ScienceDB正式启动第一届“Sc ...
论文访问量统计
论文访问量统计