预防医学/临床试验设计原则
设置对照,研究对象随机分组和盲法是临床试验设计的三项原则。
一、设置对照
有比较才能鉴别。某种治疗措施只有与其他治疗方法比较,才能了解其优劣。因而,设置对照是科学地评价一项治疗措施必不可少的。
(一)设置对照的意义
1.科学地评定药物疗效临床医学虽较前有了长足的进展,目前依然有不少疾病(尤其是慢性病)的自然史不能预测,而判断某一患者的预后尤为困难。临床医生正是运用疾病自然史和预后来评价疗效的。如在某些急性自限性疾病,像上呼吸道感染或胃肠炎等,患者即使不治疗也可因其自然转归,症状可消失而自愈。在慢性非自限性疾病时,其自然史也会出现缓解、复发、缓解和活动的交替过程,如系统性红斑狼疮,在用药物治疗该病时,若未设对照组,则极易将疾病的缓解误认为是药物的疗效。
2.排除非研究因素对疗效的影响临床试验中,除研究因素外,研究对象所具备的其他因素如年龄、性别、疾病类型、病程、严重程度和治疗经历等均可影响疗效。研究人员欲排除上述各种非研究因素对疗效的影响,进而确定研究因素的真实疗效,只有设置对照才能做到。
3.确定治疗的毒副反应的可靠方法药物临床试验中,部分患者出现不同程度的异常反应是常见的。临床医师应能正确地判断上述的反应是疾病本身的表现,还是药物的毒副作用,这只有与对照组比较才能做到。国外学者曾开展一项研究以观察安妥明、烟酰胺等降脂药对冠心病患者长期疗效。服药过程中一部分患者出现心律失常。可是研究人员仅根据上述资料无法判断异常症状是疾病的自然现象,还是药物的副作用,因未同时设置对照。设置后则发现服上述两种降脂药组与对照药组心律失常发生率分别为33.3%、32.7%和28.2%。经统计学处理显示前两种药心律失常发生率与对照药的差异无统计学意义。显然,只有设置对照组才能确定降脂药的副作用。因此,未设对照的临床试验报告的毒副作用,我胶有理由对其待怀疑态度。
(二)对照的类型
临床上常用对照类型如下:
1.随机对照(randomized control)按随机化方法将研究对象分为研究组和对照组,同时分别给他们规定的治疗措施和安慰剂或不给予任何措施。观察一定期限后,比较多和分析两组的疗效,作出试验的结论。
这种对照类型的优点首先从理论上讲可使研究组和对照组外的因素,如临床特征、预后和其他因素在两组间可比。其次是能消除研究人员或患者在患者分组上的主观因素,即消除了选择偏倚。第三是应用统计学方法来比较两组疗效时,这种类型更适宜于作卡方检验和t检验,而不需要用其他方法来校正。这种对照类型的缺点是一项试验需要较多的患者,因有一半患者充当对照。此外,还涉及医德问题。
应当说明,并不是所有的临床疗效评价都要随机对照这种方法。如多年来已在临床实践中证实其疗效的疗法,如阑尾炎手术切除治疗,虽未经随机对照证实,也不再需用此法加以评价。另外,某些罕见病,困难以收集足够多的患者以及某些致死性疾病均不宜且此法来评价疗效。
2.非随机同期对照(non-randomized concurrent control)这种类型的临床试验设计是由主管的医师实施分配,或在协作科研中按不同医院加以分组,即一所医院作为对照组,依然实施现行疗法,而另一所医院作为研究组推行新疗法。经过一段时间后比较两组的疗效。这种设置对照的方法简便易行,也易为患者和医师接受。主要缺点是不同医院收治的患者在基本临床特征与主要预后因素分布上不均衡,缺乏可比性,致使临床试验的结论产生偏倚。
在国外,有人曾组织22所医院对长期争论未决的抗凝剂能否降低急性心肌梗塞病死率问题进行研究。共有2330名患者参加。根据医师的临床判断将患者分为接受和不接受抗凝剂治疗组。研究人员发现前者病死率较后者低,即8.3%比27.3%(P<0.001)。说明抗凝剂治疗可能有效。后经查阅研究资料,发现未接受抗凝剂治疗的患者组年龄较大,60岁以上的患者占该组的65%,而接受组中同年龄的患者仅为43%。未接受抗凝剂患者住院后48小时(预计抗凝剂尚未发挥作用)病死率高(12.2%比1.9%)。说明未接受组患者病情较重。从而表明上述两组除是否接受抗凝剂外,在预后因素上存在系统误差。这样,运用此型对照来解决这个争论问题难以获得正确的结论。
3.历史性对照(historical control)此型对照是一组患者(研究组)接受新疗法,将其疗效与以前某个时间用某种方法治疗的同类型患者(对照组)的疗效加以比较。这是一种非随机、非同期的对照研究。如某病于一段时间内,自然病程、诊断方法、诊断标准和治疗水平比较稳定或变化不大,并注意两组患者在临床特征、主要预后因素等保持均衡,采用此型对照评价一种疗法的疗效还是可以的。这种对照的资料来自文献和医院历资料。
此型对照的优点是:①易为患者接受,也符合医德;②省钱、省时间。其缺点是:①不少文献资料缺乏研究对象有关特征的记载,有的医院病历资料残缺不全,难以判断对比两组是否可比;②由于科学的进展,诊断手段的改进,使得一些轻型或不典型患者得到早期诊断,再加上护理技术的进步,使得对比两组疗效上的差别并不完全反映不同疗法的差异,从而使研究结论不正确。因此,对自然病程非常清楚,不治疗必死无疑的疾病用此型对照较为合适。此外,还应了解,所用的历史性对照资料与当前研究工作的时间间隔越久,可靠性就越差。
4.交叉设计(cross over design)整个设计分为两个阶段。先将研究对象随机分为研究组(A组)和对照组(B组)。第一阶段研究组接受治疗,对照组接受安慰剂。此阶段结束后,两组患者均休息(洗脱,停药)一段时间。之后再进入试验第二阶段,但两组在接受治疗措施上对调;如图31-1所示。
这种设计不仅有组间对照,而且有自身前后对照,从而降低了两组的变异度,提高了评价疗效的效率,同时也可用较少的样本完成试验。
但采用交叉设计必须有一个严格的前提,即进入第二阶段之前,两组患者的病情均与进入第一阶段时相同。这对许多临床试验来说是难以做到的,从而限制了这种研究设计的使用。
5.序贯试验(sequential trial)与一般临床试验不同,序贯试验设计可事前先不规定样本量,而是试验一个或一对研究对象后,即进行分析,决定下一步试验,到可以作出结论时即可停止试验。这样就可以避免由于不切实际地增加样本量或研究对象数量过小造成的缺陷。
图31-1 观察硫氮酮对肥厚型心肌病的疗效
资料来源:曹家琪,临床医学研究方法学,第一版,北京医科大学,中国协和医科大学联合出版社,北京1993
序贯试验有开放型和闭锁型。前者先不规定样本量,后者则规定。不论是那一型,序贯试验均可分为单向或双向试验。前者得出新药是否优于老药的结论,后者则除上述外,还要得出老药是否优于新药的结论,序贯试验按资料性质分为质反应和量反应两类。序贯试验也可配对以缩小误差,可自身前后配对,也可用条件相同的两个个体配对。在设计时还要规定观察指标的有效和无效水平,以及假阳性率和假阴性率。再查阅序贯试验边界系数表(附表31-4)绘制序贯试验边界图,后者包括接受界限(U)和拒绝界限(L)。试验开始后,实验在边界图内游动,直至接触U界限时,表示接受试药,试验结束。若接触L界限时,表示拒绝试药,试验也结束。若实验线不接触U或L界限时,表示尚不能得出确切的结论,试验尚须继续,如图31-2所示。
SF数+SF数
图31-2 冠心宁(perhexiline)对心绞痛疗效的序贯试验图
资料来源:耿贯一,流行病学,第二版,1984
序贯试验的优点是:①适合于临床应用;②节省研究对象人数;③计算方便。缺点是:①只适用于单指标试验;②不适用于大样本试验和慢性病疗效观察。
二、随机化分组
这项原则的目的将研究对象随机分配到研究组和对照组。这是设置理想均衡对照的方法。理论上,它可使已知和未知的影响疗效的因素在两组间均衡分布。具体的随机化方法请参阅第四篇有关章节。
三、盲法(blindness)
开展临床试验的目的是为了正确评价一项治疗措施的疗效,用以指导临床实践。这就需要避免各种因素对正确评价的影响,即避免这些因素产生的偏倚。随机化方法可在很大程度上消除选择偏倚,而要消除观察偏倚就要运用盲法原则。这项原则的做法是临床医师、研究对象和试验设计人员中的一个、两个或三个都不知道研究对象接受什么治疗措施。临床试验中盲法主要分为:
(一)非盲试验
在这种试验中,临床医师、研究人员和研究对象本人均知道分组情况和接受什么治疗措施。有些临床试验只能是非盲的,如探讨改变生活习惯对冠心病发病的影响。这是非盲临床试验结论常不可靠的原因。此法的另一缺点是分配到对照组的患者因多种原因退出试验的事例并非少见。
(二)单盲试验
在这种临床试验中,研究对象不知道所接受措施的具体内容,从而避免了他们主观因素对疗效造成的偏倚。临床医师了解这些措施。这样可使研究对象在临床试验过程中的安全有了保证。但此法不能避免临床医师主观因素对疗效判断的影响。另外,有时要真正“盲”患者也很困难。
(三)双盲试验
在这种类型的试验中,患者和临床医师均不知患者分组情况和接受治疗措施具体内容。这样就极大地减少了两者主观因素对判断研究结果的影响。这是此法的优点。但此法设计较复杂,实施也较困难。还要有第三者负责监督试验全过程(包括毒副反应的检查)以保证研究对象的安全。此外,在药品制作、采购、分发和观察疗效等方面要有一套严格制度,并教育工作人员切实遵守。还应认识到,在试验过程中要“盲”临床医师确实困难。
(四)安慰剂效应(placeboeffect)
多数药物既有特异作用,也有非特异作用。因而,研究对象使用安慰剂后会出现某种反应,称作安慰剂效应。如本章案例中分配到对照组的消化性溃疡患者服安慰剂两周后也呈现一定比例的临床治愈率。
安慰剂对照研究的目的不只是确定一项措施有无临床价值,更重要的是要判断某项措施的效应是否超过安慰剂所达到的。通过对比,就可知道一项治疗措施的特异的和非特异的作用程度。这对一项治疗措施的临床应用将起着指导意义。