1 临临临临临 临临临临临 临临临临临临临临 临临临临临临临临
Jan 04, 2016
1
临床研究中临床研究中数据库建立与管理数据库建立与管理
2
在临床试验里,临床数据管理 (CDM) 是一个很广义的词。它包括了在临床研究地点收集数据和对这些数据在收集的时候以及呈交给管理中心后的质量控制等步骤。”
3
宗旨是确认资料收集的完整性和正确性,并且试验数据可以很好地支持统计分析,以及最后对其试验结果的阐述和解释。
4
及时、准确和完整及时、准确和完整的临床试验的临床试验数据收集和科学合理的数据管数据收集和科学合理的数据管理,是为了获取和保证临床试理,是为了获取和保证临床试验资料的真实性。验资料的真实性。
5
临床试验数据,就资料收集而言,临床试验数据,就资料收集而言,其获取的难易程度和准确性与临其获取的难易程度和准确性与临床试验研究者接受的训练、掌握床试验研究者接受的训练、掌握的技巧、经验和知识密切相关。的技巧、经验和知识密切相关。
6
临床试验数据的获取和管理需要临临床试验数据的获取和管理需要临床研究者本着认真、负责的精神、床研究者本着认真、负责的精神、采取科学、合理的方法去处理。采取科学、合理的方法去处理。
7
《药物临床试验质量管理规范》
数据管理的目的在于把得自受试者的数据迅速、完整、无误地纳入报告,所有涉及数据管理的各种步骤均需记录在案,以便对数据质量及试验实施进行检查。用适当的标准操作规程保证数据库的保密性,应具有计算机数据库的维护和支持程序。开始试验前需设计可被计算机阅读与输入的临床报告表及相应的计算机程序。
8
ICH GCP ICH E9 统计学指导原则 ICH E3 临床试验报告
对电脑系统的补充规定
国际规范
9
相关的 ICH 条例 .. 收集数据的每一个步骤都必须通过质量控制来
保证其数据的可靠性以及收集过程的正确性 . (ICH GCP 5.1.3)
所有的临床研究数据都必须,通过一种能够使其正确地被报告、解释和确认的方式,作记录,管理和备案。 (ICH GCP 2.10, 4.9, 5.5, 5.14 and ICH E9 3.6 and 5.8)
质量保证和质量控制体系及其标准操作规程( SOP )应该保证和维持其实施,为的是确保研究的管理,数据的产生、书写和记录,报告等都和研究方案、 GCP 以及相应的规章要求相一致。 (GCP 5.1.1)
10
研究中资料的收集应该与研究方案以及在研究开始实施前确定的方案相一致 ... 主要应该集中在分析所需要的数据 (ICH E9 3.6)
如果数据在处理的时候进行了转换 , 应该将原始数据与转换后的数据相比较 (ICH GCP 5.5.4)
… 用一个明确的病例识别号码或编码来区分收集到的受试者资料 (ICH GCP 5.5.5)
11
重要性重要性
(1)(1) 数据分析和结论推导的前提数据分析和结论推导的前提 临床试验是一个前瞻性研究,很大程临床试验是一个前瞻性研究,很大程
度上数据的收集和管理是实时进行的,度上数据的收集和管理是实时进行的,任何数据管理的失误都可能切断临床任何数据管理的失误都可能切断临床试验紧紧相扣环节,造成不可祢补的试验紧紧相扣环节,造成不可祢补的损失。损失。
12
(2)(2) 衡量研究水平的依据之一衡量研究水平的依据之一 数据管理的质量反映出临床试验研数据管理的质量反映出临床试验研
究者对试验设计和试验计划的执行究者对试验设计和试验计划的执行情况,也影射着临床试验者的科学情况,也影射着临床试验者的科学态度和知识水平。态度和知识水平。
数据管理也常常作为临床试验实施数据管理也常常作为临床试验实施的主要检查内容,也是监视员和稽的主要检查内容,也是监视员和稽查人员的主要职责内容之一。查人员的主要职责内容之一。
13
数据管理基本要求数据管理基本要求 建立标准操作规程建立标准操作规程 人员培训人员培训
参与培训的人员包括临床研究者和参与培训的人员包括临床研究者和数据管理人员数据管理人员
标准操作规程实施标准操作规程实施 通过质量保证系统的实施,定期或通过质量保证系统的实施,定期或
不定期进行质量控制和检查。不定期进行质量控制和检查。
14
基本要求基本要求 所有的涉及数据管理的过程包括所有的涉及数据管理的过程包括
录入、核对、出现的错漏、修改录入、核对、出现的错漏、修改应该记录在案,以备在万一出现应该记录在案,以备在万一出现问题时能追查发生于哪个环节,问题时能追查发生于哪个环节,得到及时纠正。得到及时纠正。
有一套既适合具体情况又较为规有一套既适合具体情况又较为规范的管理程序和方法(范的管理程序和方法( SOPSOP ),),以保证数据管理的质量。以保证数据管理的质量。
15
数据确认 *数据确认 *
数据录入或纠错 *数据录入或纠错 *
核查
接受和追访 CRF, DCF 等
研究地点
数据来源
实验中心
其他相关中心 其他
设盲数据核查和书写统计分析计划书( SAP )
*
宣布整理完成的档案 *
数据库管理系统稽查和确认 *
电脑程序检查 *
数据检查和编码 *数据检查和编码 *
数据问题查询表
电子化操作 人工操作
* 需使用电脑系统的步骤
数据管理流程
16
最后数据问题的解决和数据纠正 *
最后电脑程序检查 *
数据库锁定 *
数据存档 * 最后完全档案列表 *
数据的传输 *
数据分析 *
设盲数据核查和写统计分析计划书( SAP ) *
* 需要应用电脑系统的步骤
17
1. 确认数据的来源 : 主要有研究地点,相关的实验室等;
2. 数据收集项目的确定 确定需要的数据项目 ( 研究变量 ) 定义变量 : 概念的定义 , 操作的定义 数据库说明 : 数据类型 , 单 / 重复 确认数据与原始资料一致的说明 : 数据确认说明 : 数值的检查 , 数据范围的
检查 , 缺失值 , 逻辑的检查
18
数据收集与复核数据收集与复核
(1) (1) 数据收集的基本要求数据收集的基本要求(2) (2) 数据复核数据复核(3) (3) 注意事项注意事项
19
(1) (1) 数据收集的基本要求数据收集的基本要求
及时及时 完整完整 准确准确
20
及时及时 病例报告表的填写最好能在病床边进病例报告表的填写最好能在病床边进
行,这样可以保证以一表一人的方式行,这样可以保证以一表一人的方式及时记录数据,保证了原始数据的质及时记录数据,保证了原始数据的质量,也减少了以后复核的时间。量,也减少了以后复核的时间。
21
完整完整 完整收集临床试验数据,就是要求完整收集临床试验数据,就是要求
收集所有研究对象的全部数据。收集所有研究对象的全部数据。
22
例:
依从性不好 服用药物仅 50%
中途退出或脱漏 无效而退出 不良反应严重而退出
其他
处理方法 如实记录 记录退出原因、日期、追踪等情况
严格控制退出或脱落比例<5-10%
多次联系、追踪
处理方法 如实记录 记录退出原因、日期、追踪等情况
严格控制退出或脱落比例<5-10%
多次联系、追踪
23
准确准确 设计的病例报告表应有较好的可操作性,应尽量设计的病例报告表应有较好的可操作性,应尽量
采用计量化的指标,对软指标也应尽可能地做适采用计量化的指标,对软指标也应尽可能地做适当的量化。当的量化。
保持实验室条件诸如仪器、检测环境、检测方法保持实验室条件诸如仪器、检测环境、检测方法和操作人员的相对恒定。和操作人员的相对恒定。
临床医师或资料收集者在收集资料或填写病例报临床医师或资料收集者在收集资料或填写病例报告表时需经过一定的培训,或者至少需要在填写告表时需经过一定的培训,或者至少需要在填写前熟悉填写要求和注意事项,并通过检查来确认前熟悉填写要求和注意事项,并通过检查来确认所有的试验研究者都能较为一致地掌握资料的收所有的试验研究者都能较为一致地掌握资料的收集方法。集方法。
尽量减少从原始资料中过录数据,如果进行过录,尽量减少从原始资料中过录数据,如果进行过录,应仔细查对,保证病例报告表与原始资料的一致。应仔细查对,保证病例报告表与原始资料的一致。
24
《药物临床试验质量管理规范》
病例报告表是临床试验中临床资料的记录方式。每位受试者在试验中的有关资料均应记录于预先按试验要求而设计的病例报告表中。研究者应确保将任何观察与发现均正确而完整地记录于病例报告表上。
25
(2) (2) 数据复核数据复核
自我复查自我复查 监督与检查监督与检查
26
(3) (3) 注意事项注意事项 责任与态度责任与态度 加强培训加强培训 防止错漏防止错漏 改错方式改错方式
27
改错方式改错方式 病例报告表作为原始记录,不能更改。病例报告表作为原始记录,不能更改。 更正记录或填写的错误更正记录或填写的错误时不应改变原始时不应改变原始
记录,应采用附加叙述,记录,应采用附加叙述,为便于查对应为便于查对应将错误之处划线而不是涂黑,在旁边写将错误之处划线而不是涂黑,在旁边写上正确的内容、理由、改正日期。上正确的内容、理由、改正日期。
应有当事者签名。应有当事者签名。
28
29
3. 编码 人工编码 自动编码技术 字典 : MedDRA, WHO-ART, ICD, COSTART
4. 数据的质量控制 数据跟踪 数据录入与确认 数据的核查 数据问题表 : 电脑程序检查
30
5. 数据录入前后的核查临床数据的核查由有资格的医学核查
员进行 检查和评估复杂的临床数据,发现
数据中的细微差别 对数据管理员的评估进行质量控制
检查6. 数据录入 建立数据库
31
建库录入前的工作建库录入前的工作 参与 CRF的设计
了解 CRF内容,提出建议 CRF结构设置的合理性 避免项目空缺 一致性相关项目的设置 工作的连续性
32
数据库的建库数据库的建库
数据命名与编码 建立数据字典或编码说明书 建立数据库
33
数据编码与命名数据编码与命名 变量(字段)命名
由项目名称的汉语拼音字母(英文字母)及数字组成前缀
观测时点顺序码 例如:例如: ZZ1_0, ZZ1_1, ZZ1_2ZZ1_0, ZZ1_1, ZZ1_2
变量值的编码 编码:用数字代替文字内容,以便录入和统计 分析
分类资料 计量资料
34
数据文件的命名 数据库命名,如WTJN.DBF 检查程序,如WTJN.CHK 分析程序,如WTJN.PRG 记录文件,如WTJN.LOG 结果文件,如WTJN.RST
采用相同前缀的方法命名同一研究的所有数据文件
35
建立数据字典或编码说明书建立数据字典或编码说明书 项目内容及变量命名 各个变量值编码意义 变量(字段)与另一变量(字段)的逻辑关系
变量的转跳( Skip )关系 变量取值范围或基本情况
36
XXX 药物临床试验病例报告表编码本 (1996年7月 )
GR, 1,2,N: 组别 :1 一号组 2二号组BH, 3,4,N: 编号 : 1001~3121SEX, 7,1,N:性别 :1男 2女 AGE, 8,3,N: 年龄MZ, 11,1,N: 门诊与住院情况 :1门诊 2住院BC1, 12,3,N: 反复发作 (月 )BC2, 15,2,N: 近期发作 (月 )XY, 17,2,N: 西医诊断 : 十二指肠溃疡 (活动期 )ZY, 19,2,N: 中医辨证 :1寒热错杂证 2寒热错杂证兼气滞证 3寒热错杂证兼气滞血瘀证YF, 21,2,N: 诱发因素 :1 受寒 2情志不舒 3饥 4饱 5 生冷 6烟 7 酒 8 过劳HJ, 23,2,N: 缓解因素 :1 得食 2减食 3不食 4 得温 5 得冷 6休息 7 矢气 8排便 9按压EFFECT1, 25,2,N:中医证候疗效 :1 临床痊愈 2显效 3 有效 4 无效EFFECT2, 27,2,N: 胃镜疗效 :1 临床痊愈 2显效 3 有效 4 无效DRUG, 29,1,N:是否用药 :1 是 2否
SYA0, 30,1,N: 胃脘疼痛 :分为 0到 3级 (治疗前 )SYA1, 31,1,N: 胃脘疼痛 :分为 0到 3级 (治疗后 1周 )SYA2, 32,1,N: 胃脘疼痛 :分为 0到 3级 (治疗后 2周 )SYA3, 33,1,N: 胃脘疼痛 :分为 0到 3级 (治疗后 3周 )SYA4, 34,1,N: 胃脘疼痛 :分为 0到 3级 (治疗后 4周 )SYA4T, 35,1,N: 胃脘疼痛 :分为 0到 3级 (停药后 4周 )
SYB0, 36,1,N: 胃脘部压痛 :分为 0到 3级 (治疗前 ) SYB1, 37,1,N: 胃脘部压痛 :分为 0到 3级 (治疗后 1周 ) SYB2, 38,1,N: 胃脘部压痛 :分为 0到 3级 (治疗后 2周 ) SYB3, 39,1,N: 胃脘部压痛 :分为 0到 3级 (治疗后 3周 ) SYB4, 40,1,N: 胃脘部压痛 :分为 0到 3级 (治疗后 4周 ) SYB4T, 41,1,N: 胃脘部压痛 :分为 0到 3级 (停药后 4周 )
37
建立数据库建立数据库 熟悉数据库软件操作 根据 CRF和数据编码 /数据字典
合理设置变量(字段)类型和宽度 合理设置变量(字段)取值范围 合理设置变量(字段)转跳( Skip )
38
数据录入二次录入
同人不同时间 不同人
校对录入 自动扫描录入
软件支持
39
数据录入数据录入 基本要求基本要求
必要的岗位培训和录入前培训必要的岗位培训和录入前培训 熟悉数据库录入操作熟悉数据库录入操作 熟悉数据录入的熟悉数据录入的 SOPSOP 熟悉熟悉 CRFCRF的各个项目结构、编码等的各个项目结构、编码等
质量控制质量控制
40
录入的质量控制录入的质量控制 岗位培训;岗位培训; 录入过程发现问题或意外情况,应做录入过程发现问题或意外情况,应做
好登记好登记 ((问题查询表问题查询表 )) 并及时报告,并及时报告,以便迅速处理问题;以便迅速处理问题;
抽查部分病例报告表,了解录入质量,抽查部分病例报告表,了解录入质量,分析并处理存在的问题。分析并处理存在的问题。
41
录入数据的复查录入数据的复查 首先,可以编写程序对数据库中的数据进行一致首先,可以编写程序对数据库中的数据进行一致
性检查,包括各变量的可能取值范围及它们之间性检查,包括各变量的可能取值范围及它们之间的逻辑关系。的逻辑关系。
然后,做简单的描述性统计,分析变量的频数分然后,做简单的描述性统计,分析变量的频数分布表、最大值、最小值、百分位数、茎叶图、盒布表、最大值、最小值、百分位数、茎叶图、盒形图等以发现异常值。形图等以发现异常值。
列出存在问题的病例报告表清单,依次进行重录,列出存在问题的病例报告表清单,依次进行重录,如属原始数据的问题应返回给临床医师或资料收如属原始数据的问题应返回给临床医师或资料收集者进行查对。集者进行查对。
随机抽查。随机抽查。
42
质量控制,发现极端值 以均数±2 个标准差作为
上、下警戒值; 以均数±3 个标准差作为
上、下控制值。
43
7. 数据整理 在进行了以下的步骤以后进行数据的
整理并且传送至最终的数据库: 有问题数据得到了解决 数据录入已完成并得到确认或已抽样进
行质量控制 所有有关安全性和有效性的主要数据都
进行了质量控制核查 所有与研究方案不相符的事件都进行了
报告和分类,并且澄清了相关的影响
44
8. 设盲数据核查与数据库锁定 在确认了资料的真实性,盲态数据核
查完成后,进行锁定,最后分析 与研究者一起进一步明确分析的目的并
且明确分析的顺序 接受数据库并对资料进行初步的分析 进行初步数据分析 (IDA) 为最后的分析制定草案写成或修改统计
分析计划书 (SAP)
45
数据库核查完毕应进行锁定 防止误操作 防止未经授权的修改
46
9. 数据列表 准备一份临床研究报告所需要的数据
列表10. 数据的传输和存档 将数据传输给
申办者 统计人员 法规管理部门 , 如电子数据的呈递
47
资料保存 (1) 原始病例报告表格的保存
归类 编号
便于检索、查找
48
(2)(2)电子数据文件的保存电子数据文件的保存
所有电子数据文件(包括数据库、检查程序、所有电子数据文件(包括数据库、检查程序、分析程序、分析结果、编码本和说明文件等)分析程序、分析结果、编码本和说明文件等)应分类保存,除数据库外的有关文件,最好能应分类保存,除数据库外的有关文件,最好能以硬拷贝保存。以硬拷贝保存。
登记相关数据文件保存的物理位置(计算机路登记相关数据文件保存的物理位置(计算机路径)。径)。
数据清理完毕,数据库应加密或防止未经授权数据清理完毕,数据库应加密或防止未经授权者接触数据,以只读属性保存以防被误写,并者接触数据,以只读属性保存以防被误写,并应有多个备份保存于不同磁盘或记录介质上。应有多个备份保存于不同磁盘或记录介质上。
所有存储数据文件的介质应注意妥善保存,防所有存储数据文件的介质应注意妥善保存,防止损坏。止损坏。