摘要:通过收集书籍手册中的化学药物研究成果信息,对收集的药物数据信息进行分类汇总和规范化处理,采用化合物唯一标识法集成药物化合物结构数据,利用数据采集规范和数据抽查回溯手段控制数据质量,通过算法程序保证数据集中关键数据项的正确率,最终形成化学药物数据集。本数据集包括了药物基础数据和药物化合物数据,共计1060条。化学药物数据集可以为新药研发、药物改良、科研教育等提供数据支持。
关键词:药物数据;化学药物;药物化合物;新药研发
数据库(集)名称 | 化学药物数据集 |
数据作者 | 徐挺军、赵英莉、李英勇 |
数据通信作者 | 徐挺军(xutingjun@sioc.ac.cn) |
数据时间范围 | 1985–2001年 |
地理区域 | 世界各国 |
数据量 | 5.44 MB |
数据格式 | *.MDB |
数据服务系统网址 | http://www.sciencedb.cn/dataSet/handle/657 |
基金项目 | 中国科学院信息化专项科学大数据工程(XXH135)、上海市化学化工数据共享服务平台(18DZ2294000) |
数据库(集)组成 | 数据集由2部分数据组成:1. 药物基础数据(包括药物类型、名称、性状、制法、用途、生产厂家等);2. 药物化合物数据(包括化合物登录号、CA登记号、化合物名称、分子式、分子量、化学结构文件等)。 |
Title | A dataset of chemical drugs |
Data corresponding author | Xu Tingjun(xutingjun@sioc.ac.cn) |
Data authors | Xu Tingjun, Zhao Yingli, Li Yingyong |
Time range | 1985-2001 |
Geographical scope | Worldwide |
Data volume | 5.44 MB |
Data format | *.MDB |
Data service system | http://www.sciencedb.cn/dataSet/handle/657 |
Sources of funding | CAS informatization project during the Thirteenth Five-Year Plan (XXH135); Shanghai Chemistry & Chemical Industry Data Platform(18DZ2294000) |
Dataset composition | This dataset consists of two parts of data, one for basic drugs (including their type, name, properties, preparation, application, manufacturer, etc.) and the other for drug compounds (including their registration number, CA registration number, name, molecular formula, molecular weight, chemical structure, etc.). |
序号 | 规则说明 |
---|---|
1 | 同一类数据中有多个数据的使用“;”分隔,如同一个药物有多个名称,多个参考文献等 |
2 | 内容描述中每个自然分段的结尾部分加“$$” |
3 | 如果内容中有表格,在表的起始和结束后各加一个“$T”,表内容的每一项用“/”或“@”(当表的内容中有“/”时)分隔,每一行用“$$”分隔 |
4 | 化学结构式中的结构图不需输入 |
5 | 所有汉字和符号,包括希腊字母按原样输入 |
6 | 分子式中的数字按普通数字方式输入,其余上下标内容使用上标符组“^<”“^>”,和下标符组“^{”“^}”表示,需要用上下标表示的内容置于上标或下标符号组的两个符号间。例如,cm-1应该表示成“cm^<-1^>” |
7 | 熔点(mp)、沸点(bp)、酸碱度(PH)的数据包含在性状内容中,需要从中选取,输入内容包括这些数据的标识。 |
序号 | 数据类型 | 数据示例 |
---|---|---|
1 | 药物编号 | 374 |
2 | 药物大类 | 心脑血管药物 |
3 | 药物小类 | 抗高血压药 |
4 | 药物中文名称 | 缬沙坦 |
5 | 药物英文名称 | Valsartan |
6 | 性状 | 从二异丙醚结晶,熔点116--117℃。 |
7 | 熔点 | 116-117℃ |
8 | 沸点 | - |
9 | 酸碱度 | - |
10 | 制法 | 2’-氰基联苯-4-醛(I)和L-缬氨酸甲酯进行还原胺化,得到的化合物(II)再用戊酰氯进行酰化,层析后得到化合物(III)。然后和Bu3SnN3进行反应,引入四唑,再水解即得产物。 |
11 | 用途 | 抗高血压药物。非肽血管紧张素II AT1-受体拮抗剂。用于治疗高血压。 |
12 | 生产厂家 | 瑞士Ciba开发,1996年在德国上市。 |
13 | 参考文献 | [1] Merck Index 12th:10051;[2] Buehlmayer P,Ostermayer F and Sehmidlln T.Aeyl compounds.EP 443983,1991-08-28;$$[3]Buehlmayer P,Ostermayer F and Schmidlin T.Acyl compounds.US 5399578,1995-03-21. |
序号 | 缩写符号 | 说明 |
---|---|---|
1 | ![]() | 旋光度,下标为光源,上标为温度 |
2 | ![]() | 折射率,下标为光源,下标为温度 |
3 | ![]() | 相对密度,指一定体积的该物质在23℃下的质量与等体积纯水在4℃下的质量之比 |
4 | ![]() | 消光度,下标为槽的厚度,上标为样品的浓度 |
5 | ε | 分子消光系数 |
6 | mp | 熔点 |
7 | bp | 沸点 |
8 | pH | 酸碱度 |
9 | pKa | 电解质电离常数倒数的对数 |
10 | Ac | 乙酰基 |
11 | Bz | 苯甲酰基 |
12 | Bzl | 苄基 |
13 | Bu | 丁基 |
14 | Et | 乙基 |
15 | Me | 甲基 |
16 | Ph | 苯基 |
17 | Pr | 丙基 |
18 | Ts | 对甲苯黄酰基 |
19 | 7-ACA | 7-氨基头孢烷酸 |
20 | 7-ACT | 7-氨基头孢三嗪 |
21 | 6-APA | 6-氨基青霉烷酸 |
22 | DCC, DCCD | 二环己基二亚胺 |
23 | DMA | N,N-二甲基乙酰胺 |
24 | DMF | N,N-二甲基甲酰胺 |
25 | DMSO | 二甲基亚砜 |
26 | THF | 四氢呋喃 |
27 | IR | 红外光谱 |
28 | UV | 紫外光谱 |
29 | USP | 美国药典 |
30 | DE | 德国专利 |
31 | EP | 欧洲专利 |
32 | GB | 英国专利 |
33 | JP | 日本专利 |
34 | US | 美国专利 |
35 | WO | 世界专利 |