国家农业科学数据共享中心专题 I 区论文(评审中) 版本 ZH2
下载
生物种业研发信息数据库
A database for biotech-seed research and development
 >>
: 2017 - 12 - 04
: 2018 - 03 - 12
: 2018 - 03 - 12
1106 1 0
摘要&关键词
摘要:随着农业生物技术的发展,近几年我国作物生物育种研究已经达到了国际先进水平,研制出一大批具有优良性状的植物新品种,促进了我国农业高效精准育种的升级转化。本数据集收集了生物种业研发相关信息数据库,将分散的生物育种信息进行人工整合,涉及棉花、玉米、水稻、大豆、小麦、油菜、蔬菜、杂粮和其他等9个大类作物种类,主要包含生物育种技术类型、植物种属信息、改良基因信息、目标性状特点、研发单位信息等。对该部分信息进行系统整合并关联分析,有助于理清当前我国作物生物种业发展现状,可为生物种业相关研发单位、高校及企业提供重要信息,对推动我国农业生物技术的产业化具有重要意义。
关键词:生物技术;生物种业;数据集;作物
Abstract & Keywords
Abstract: With the development of agricultural biotechnology in recent years, research on biotech breeding in China has reached an internationally advanced level. Many high-performance varieties have been developed, which promoted the upgrading and transformation of high efficiency and precision breeding in China. This dataset collects and manually integrates scattered information on biotechnological breeding for the research and development of biotech-seed industry. The database includes nine crop categories, including cotton, corn, rice, soybean, wheat, rape, vegetable, cereal, and others, which records information on biotech-breeding type, plant species, genetic modification, target traits, R&D institutions, etc. To systematically integrate and correlate this information helps to understand the current situation of crop biotechnology in China. The database provides important information for research institutions, universities and enterprises of the biotech-seed industry, which promotes the industrialization of agricultural biotechnology in China.
Keywords: 
数据库(集)基本信息简介
数据库(集)名称生物种业研发信息数据库
数据作者邹婉侬、赵金彤、刘肖静、陈振华
数据通信作者王友华(wangyouhua@caas.cn)
数据采集时间2017年8月
数据格式.xlsx
数据量1077条
数据服务系统网址http://www.sciencedb.cn/dataSet/handle/553
数据库(集)组成数据集包括9种作物的子数据库,数据量1077条,它们分别为:1.棉花生物育种技术数据库,数据量为280条;2.玉米生物育种技术数据库,数据量为112条;3.水稻生物育种技术数据库,数据量为107条;4.大豆生物育种技术数据库,数据量为74条;5.小麦生物育种技术数据库,数据量为76条;6.油菜生物育种技术数据库,数据量为132条;7.蔬菜生物育种技术数据库,数据量为152条;8.杂粮生物育种技术数据库,数据量为81条;9.其他作物生物育种数据库,数据量为63条。
Dataset Profile
TitleA database for biotech-seed research and development
Data authorsZou Wannong, Zhao Jintong, Liu Xiaojing, Chen Zhenhua
Data corresponding authorWangYouhua (wangyouhua@caas.cn)
Time rangeAugust, 2017
Data volume1077 entries
Data format.xlsx
Data service systemhttp://www.sciencedb.cn/dataSet/handle/553
Database compositionThis database includes 9 kinds of crops, with a total volume of 1077 entries. They are: 1. Biological breeding technology for cotton, 280 entries; 2. Biological breeding technology for corn, 112 entries; 3. Biological breeding technology for rice, 107 entries; 4. Biological breeding technology for soybean, 74 entries; 5. Biological breeding technology for wheat, 76 entries; 6. Biological breeding technology for rape, 132 entries; 7. Biological breeding technology for vegetables, 132 entries; 8. Biological breeding technology for cereal, 152 entries; 9. Biological breeding technology for other crops, 63 entries.
引 言
生物技术是指人们以现代生命科学为基础,结合其他基础学科的科学原理,采用先进的科学技术手段,按照预先的设计改造生物体或加工生物原料,为人类生产出所需产品或达到某种目的[1]。农业生物技术是21世纪发展最快、突破最大、前景最广的战略高新技术。通过利用植物中的特定基因,可以提高耕地的利用率,减少农药的使用,帮助植物对抗恶劣的天气,同时可以改善食品的营养和口感等。通过生物技术对植物进行改造,已经在很多方面有了深入的发展,包括抗虫、抗除草剂、抗病毒、抗逆和品质改良等方面[2]。我国生物农业技术的整体水平目前在发展中国家中已经处于领先地位,转基因植物研究领域已达国际先进水平。但目前我国科技研发产业链条的各个阶段相对独立,大部分研究成果掌握在高校与科研机构手中,而产业化企业自身难以支撑自主研发,同时在寻找切合自身产业定位的上游成果时如同大海捞针,缺少针对性,使得我国企业在发展过程中受制于人。《“十三五”国家战略性新兴产业发展规划》中提出了要完善农业科研院校科技成果快速转化应用机制,建立农业科技成果转化应用信息系统,定期筛选发布重大农业知识产权目录,加强知识产权价值评估和侵权评价认定技术研究,搭建重大知识产权信息共享应用平台[3]
我们对棉花、玉米、水稻、大豆、小麦、油菜、蔬菜、杂粮和其他9个大类作物的主要信息的搜集与整理,建立生物种业研发信息的数据库,将生物育种技术类型、植物种属信息、改良基因信息、目标性状特点、知识产权拥有类型、研发单位信息等信息整合到一起,建立一个系统的数据库,便于有需求的人更加快速地寻找合适的作物品种信息。
1   数据采集和处理方法
1.1   数据来源
数据主要通过网络查询、文献检索、专利信息调研等途径,从农业部、中国知网、国家科技成果网、国家知识产权局、国家知识产权项目库、转基因作物数据库及其他商业性数据库等网站进行检索,搜集我国现有的生物种业研发相关信息,利用专业人员将分散的类型、植物类别、生物技术目标性状等方面进行人工对接整合,建立生物种业产业化信息数据库。下设棉花、玉米、水稻、大豆、小麦、油菜、蔬菜、杂粮、其他植物等9个子数据库。各库的每条信息包含有生物育种技术类型、植物种属信息、改良基因信息、目标性状特点、成果名称、成果编号、研发单位信息、研发单位名称信息、发明人、知识产权拥有类型、产业化程度等信息。
1.2   数据的整理
数据的整理主要包括原始记录信息的检查和完善、数据的录入及补充,将其依次归类。通过整理分析,我们共搜集相关作物信息共1077条。其中棉花280条,主要目标性状为抗虫;玉米112条,主要目标性状为品质改良和提高产量;水稻107条,主要目标性状为抗非生物逆境;大豆74条,主要目标性状为抗除草剂和品质改良;小麦76条,主要目标性状为抗非生物逆境;油菜132条,主要目标性状为品质改良;蔬菜152条,主要目标性状为抗病;杂粮81条,其主要目标性状为品质改良;其他作物63条。
1.3   数据的主要框架结构
生物育种技术类型有多种,其中包括杂交育种、基因编辑、细胞诱变、转基因、倍性育种和分子辅助育种等。而每种作物通过生物育种技术最终所要改良的目标性状不同,包括品质改良、产量提高、抗性增强、营养强化、株型改良、花期控制、早熟晚熟等,本数据库按照作物品种分为棉花、玉米、水稻、大豆、小麦、油菜、蔬菜、杂粮和其他作物9大类,将生物技术类型和目标性状作为主要的检索目标,通过本数据库可以检索某类作物的生物育种技术类型,进而找出所需要改良的目标形状的品种,也可以通过检索某类作物所要达到的目标性状,找出所对应的不同生物育种技术的相关品种。


图1   生物种业研发信息数据库框架结构图
2   数据样本描述
本数据库的数据多数来源于从农业部、中国知网、国家科技成果网、国家知识产权局、国家知识产权项目库、转基因作物数据库及其他商业性数据库等网站,涵盖专利、品种权、安全证书等科技成果类型,数据来源具有较强的权威性。本数据库整合了有关生物育种技术成果的有关信息,分成9类作物品种的子数据库,并进一步进行加工分类,在海量的成果信息中提取例如技术类型、种属信息、改良基因信息、目标性状特点等有效的信息点。例如蔬菜生物育种技术数据库通过了国知局、智慧芽和知呱呱数据源进行数据采集。其中包含了白菜、番茄、黄瓜等蔬菜,种属信息包括十字花科、茄科、葫芦科等。同时涵盖了大量的目标性状特点,包括品质改良、产量提高、株型改良、抗病、抗非生物逆境、早熟晚熟等性状。研发机构也覆盖了中国农业大学、中国农业科学院等科研院所及中粮屯和种业有限公司等多家企业研发单位。本数据库数据信息的多元化更加有利于下游企业获取有利的信息,推动生物技术成果的产业化进程。
3   数据质量与评估
本数据库的数据多数来源于公益性权威机构,例如国家知识产权局和农业部,具有很强的权威性,也有很大部分来源于中国知网、智慧芽全球专利数据库及知呱呱知识产权平台等商业数据库。其中,中国知网为我国最大的知识资源高效共享平台;智慧芽全球专利数据库和知呱呱知识产权平台集合了全球100多个国家1.2亿以上的专利数据,并且每周对专利信息进行更新,利用这两个专利数据库可以满足数据来源数量要求。同时,本数据库所有信息采集人员均为农业生物技术领域研究生层级以上,具有较强的专业知识与科研素养,能够进一步保证本数据库信息的真实性与准确性。但受限于其中有些作物品种由于检索来源及原始信息不完全公开,本数据库存在部分信息缺失的现象,进而造成数据内容的不完整。
4   数据价值
本数据库主要应用于农业领域。通过数据库提供的资源,更有利于生物种业需求单位对我国生物种业成果信息进行检索,了解其产业化程度,并选择切合自身产业定位的成果来进行产业化生产,可以着力解决我国上游基因知识产权成果信息散乱不完整的问题。当前我国各高校与科研院所拥有海量专利成果但缺乏系统的整合,而大量的产业化企业由于基础研发力量薄弱而缺少大量基因产权,要检索农业生物技术相关成果将会耗费大量的时间,因此通过某种途径能够寻找较全面的成果信息集合尤为重要。我们构建一个生物种业研发信息数据库,将生物育种技术类型、植物种属信息、改良基因信息、目标性状特点、研发单位信息、知识产权拥有类型、产业化程度等信息整合到一起,建立较完整的数据库。生物种业运行的相关单位可以从“生物种业产业化数据库”直接检索符合本单位需求的生物种业成果,直接联系成果所有权单位开展合作,从而推动转基因植物的产业化应用,有利于促进生物产业上游与下游的信息对接。例如,如果某家公司想要产业化生产某种抗除草剂的大豆,便可以通过本数据库筛选出通过不同的生物育种技术改良的抗除草剂大豆,并可以根据所提供的对应研发单位名称来进行育种技术或品种的使用权沟通。这有助于实现生物种业科技成果由上游研发单位向下游企业转移,推动我国农业生物技术的发展,保障国家粮食安全。
5   数据的使用方法及建议
本数据已共享到Science Data Bank(http://www.sciencedb.cn/dataSet/handle/553),供科研人员和公众下载,并根据具体需求对数据库进行检索及使用。使用本数据库可以在作物品种、生物育种技术、目标性状等信息之间进行相互检索,例如针对作物品种类别进行检索,筛选其中的生物育种技术及目标性状,或更进一步选择生物育种技术类型,进而寻找所需要的目标性状。也可以针对某一目标性状,对相应的作物品种及生物育种技术类别进行检索。
本数据库后续将会不断更新数据信息,扩大数据库的生物种业成果数量,扩充数据内容,完善数据结构,最大化满足使用者的需求。
数据作者分工职责
王友华(1983—),男,江苏省南通市人,硕士,助研,研究方向为知识产权、科技管理。主要承担工作:总体方案设计与组织实施。
邹婉侬(1993—),女,辽宁省鞍山市人,硕士,学生,研究方向为区域发展。主要承担工作:数据整理与分类汇总。
赵金彤(1993—)女,河北省保定市人,硕士,学生,研究方向为微生物分子生物学与基因工程。主要承担工作:玉米、蔬菜及油菜的数据采集。
刘肖静(1993—),女,山西省长治市人,硕士,学生,研究方向为转基因安全评价。主要承担工作:棉花、小麦及杂粮的数据采集。
陈振华(1993—),男,河北省秦皇岛市人,硕士,学生,研究方向为植物分子生物学与基因工程。主要承担工作:大豆、玉米及其他作物的数据采集。
[1]
刘德立.现代生物技术与应用[J].国际学术动态,1996: 11–15.
[2]
刘晨曦,吴孔明. 转基因棉花的研发现状与发展策略[J]. 植物保护,2011 (9): 11–17.
[3]
国务院印发《“十三五”国家战略性新兴产业发展规划》[EB/OL].(2017-9-22)[2016–12–21]. http://www.miit.gov.cn/n1146290/n1146392/c5426719/content.html.
数据引用格式
邹婉侬, 赵金彤, 刘肖静, 陈振华. 生物种业研发信息数据库[DB/OL]. Science Data Bank, 2018. (2018-01-02). DOI: 10.11922/sciencedb.553.
稿件与作者信息
论文引用格式
王友华, 邹婉侬. 生物种业研发信息数据库[J/OL]. 中国科学数据, 2018. (2018-03-08). DOI: 10.11922/csdata.2017.0010.zh.
王友华
Wang Youhua
主要承担工作:总体方案设计与组织实施。
wangyouhua@caas.cn
(1983—),男,江苏省南通市人,硕士,助研,研究方向为知识产权、科技管理。
邹婉侬
Zou Wannong
主要承担工作:数据整理与分类汇总。
(1993—),女,辽宁省鞍山市人,硕士,学生,研究方向为区域发展。
出版历史
I区发布时间:2018年3月12日 ( 版本ZH2
参考文献列表中查看
中国科学数据
csdata