预防医学/临床试验设计的组成部分
临床试验的目的是观察和论证某个或某些研究因素对研究对象所产生的效应或影响。因此,在设计一项临床试验时应包括研究因素、研究对象和出现效应三个部分。
一、研究因素
(一)研究因素的性质
一般说来,研究因素是自外界强加给研究对象的。从性质上说它们是生物、化学和物理等因素。此外,在某些疾病,研究对象自己所具有的某些特征,如年龄、性别等也可作为研究因素。
随着医学的进展和医这模式转向“生物-社会-心理医学模式”,人们逐渐认识到除外界环境的物质因素外,病因尚包括人体内环境各种有害因素,如某些遗传因素,还包括体内外环境共同作用下产生的心理因素。如目前已有不少资料表明,A型性格的人易患冠心病。因而,可以认为人的心理状态可能是某些疾病的发病因素。
人的某些不良生活方式如吸烟、酗酒可能是某些疾病如肺癌、肝硬化的发病因素。
在设计一项临床试验时,研究人员应十分明确研究因素是什么,其性质为何?而且要求它们充分体现临床科研的本意。
(二)研究因素的强度
任何性质的因素都有一个量的问题,在临床试验中称作研究因素的强度。研究人员在设计一项临床试验时必须慎重考虑这个问题,即所使用的研究因素的次数,每次的剂量,疗程的数量以及研究因素的总量等。如研究对象本身的某些特征也作为研究因素时,其中也有一个与强度相类似的问题,如年龄的大小。
在设计时要注意掌握研究因素的使用强度,过大则可使研究对象受到伤害或在临床实践上无法使用,过小则难以出现预期的效应。如以观察药物疗效为例,使用的剂量应在最小有效剂量和最大不中毒剂量范围之内。
此外,在试验设计时还要充分考虑用药的途径,用药的时间间隔等。这些均可对药物(研究因素)的强度产生影响。
(三)研究因素的实施方法
一般说来,经过阅读文献和开展小规模的预试验就可以找出使用研究因素的适宜强度,并在此基础上制订出使用常规和制度。在正式试验中一般不允许变动,称作标准化。这样作的目的可使研究因素的强度始终一致,获得的资料可比,对论证研究因素与出现效应之间的关联较为有利。但在临床实践中,由于病情的变化,使标准分法有时难以实施。
在使用常规中,还应规定具体的使用方法。以化学药物为例,应规定药名、生产厂家、批号、有效期限等。由于中草药的情况复杂,在使用时要规定其种属、产地、收获季节、泡制方法、每日次数、每日剂量等。
临床试验实施过程中,拟订的标准化措施有时未被遵守,以致试验无法进行。在疾病的症状有所缓解,体征有所改变或在试验的后期上述情况容易出现。所以在设计中要规定及时发现和克服这种情况的方法。
二、研究对象
在临床试验设计中选择研究对象是一个重要问题,应慎重对待。临床上有时为了确定某项指标的正常值可选正常人作为研究对象。但这是少数。多数是选择某病患者作为研究对象。此时应规定明确的诊断标准以选择患者,并避免将未患所研究疾病的人或患其他疾病者选入。
(一)应根据国际疾病分类和全国性学术会议规定的诊断标准来选择患者,因为这些标准具有权威性,还可比较同类的研究结果。
有时某些疾病尚无公认的诊断标准,研究人员可自行拟订。此时应尽量采用客观指标,如病理组织学、微生物学、生物化学、免疫学、X线、内窥镜所见等。为了解其灵敏度和特异度,研究人员要在患者身上进行多次检验。
符合诊断标准的患者也未必都选作研究对象,如患者年龄太大或过于体弱。应根据研究工作的目的,在诊断标准的基础上制订入选标准。此项标准应规定适当,如太高,将增加选择研究对象的困难,太低,又可影响研究工作的真实性。例如在使用吲满酰胺治疗高血压的研究中,研究人中根据国际标准选择一批高血患者,从中选出82名原发性高血压患者作为初步的研究对象。住院后先服安慰剂两周,发现18例患者因血压水平低于上述标准而被剔除。这个例子说明应根据入选标准选择研究对象。
设计时还应规定排除标准,即有些患者虽符合诊断标准,但仍不能选作研究对象。如该患者同时患另一种可影响本试验效果的疾病时,就不宜选作研究对象。此外,选中的患者也不宜同时患其他病情险恶的疾病,因为这样的患者可在研究过程中死亡或因病情恶化而被迫退出。再者已知研究对象对药物有不良反应时也不应将之选入。如不应将曾患胃出血者选作抗炎药物试验的对象。
如用呋喃唑酮治疗消化性溃疡作双盲对照研究时,规定了研究对象入选标准为“因上腹痛或上消化道出血就诊,并经胃镜证实为活动性溃疡”的患者。排除标准包括胃手术后吻合口溃疡,伴有严重肝病、胃癌和对呋喃唑酮过敏者。又如在应用吲满酰胺治疗高血压研究中,入选的原发性高血压患者应无水肿、未患严重心绞痛、急性脑血管病等。
(二)选择研究对象时应注意的其他事项
1.入选的研究对象确能从科研中受益如评价药物的疗效,研究人员应清楚地掌握该药的作用机理、适应证、禁忌证或敏感菌株等资料。这样就可选入敏感菌株感染的患者,而使后者受益,从临床试验角度来说也可获得阳性结果。
有关选择新旧患者问题应具体分析。一般说来在常见病、多发病的研究中要尽可能选择新发病患者作为研究对象,因为旧患者难以充分反映药物的疗效。若检验或估计新药的特殊疗效,可选择经多种方法久治未愈的患者,这样可较易判断疗效,因其本身就是一个历史对象。至于罕见病,因新病例数较少,在临床试验中不得不选入一些旧患者。
2.研究对象的代表性从临床试验出发,要求选入的研究对象在病型、病情以及年龄、性别等方面具备某病的特征,即代表性强。这样,试验获得的结论将具有明显的实用价值。若代表性差,科研结果的适用范围将受到限制。如1967年国退伍军人管理局抗高血压治疗试验中,只包括那些充分合作并能坚持治疗到底的未患继发性高血压和尿毒症的男性患者。这项工作组织严密,结论获得公认。但它只说明抗高血压药在最好条件下治疗高血压是有益的,或许不适用于一般高血压患者,如女性高血压患者。
若一项治疗措施的机理目前尚难肯定,或其机理不是单一的,可引起多种效应,此时应选择多质性的研究对象。如根据个人的具体情况进行体育锻炼的降低冠心病发病率或死亡率的临床试验,其机理可能是增强心脏功能,减轻体重,健全了意志或其他未知的作用所致。此时就要从不同性别、年龄、文化程度、职业和病型的患者中选择研究对象,否则就不能全面反映体育锻炼的效应。
3.选择依从性好的患者作研究对象为了获得准确的结果,研究人员通过观察和谈话以了解患者的情况,从中选择那些能够服从试验安排并坚持合作的患者作研究对象。若不依从患者的数量较大,研究结果就会出现误差。
4.志愿者(volunteer)选作研究对象的问题值得商榷。在我国,有些人出于崇高的目的和献身精神接受试验,这是值得称赞的。但这是少数。由于以下的理由,多种学者对这个问题持慎重态度,即志愿者多有难言的苦衷,如经济困难或自身患病求医心切等。这些均可对研究结果产生影响,甚至可出现假阳性应答。再者,志愿者代表性差。
三、估计参加试验的人数,即估计样本量
其目的是协助研究人员正确估计本次试验所需的样本量,以便能得出有意义的结论。估计样本量时,要遵循以下四项原则,以避免样本量过大或过小。
(一)四项原则
1.试验中所用的研究因素的有效率。有效率越高,样本量就可少些,反之就要多些。
2.要求的精确度越高,样本量就要多,反之就可少些。
3.第一型(α)错误出现的概率,即出现假阳性错误的概率。如将无效的研究因素错误地判断为有效的危险率,以α表示。α水平由研究人员自行确定,通常取0.05或0.01。取0.01时,所需的观察人数比0.05时为多,即要求的显著性水平越高,样本量就越多。
4.第二型(β)错误出现的概率,即出现假阴性错误的概率。如将有效的研究因素错误地判断为无效的概率,以β表示。β水平也由研究人员自行确定,一般取β为0.2、0.1或0.05。1-β称把握度,即有80%、90%或95%的把握度。若将把握度订得高些,样本量就应多些。
(二)临床试验估计样本量的例子(录自耿贯一主编的《流行病学》1984年版)
1.两样本率的比较单侧检验和双侧检验不同,可查本章末附表31-1到31-3。
例青霉素治疗慢性气管炎的近期控制率过去经验为20%。现试用中草药治疗,以青霉素治疗为对照,要求该中草药的近期控制率达40%才值得推广使用,则每组最少要多少病例才能得出两者差别有统计学意义(设α=0.05,把握度1-β=80%)。
则P1=20,P2=40,S=40-20=20,题意要求中草药疗效较青霉素高,系单侧检验。查附表33-1,得63。即每组最少需63例,两组共需126例。
2.计量资料的配对比较(t检验)所需样本量配对有多种形式,最常用的是将病人按其特点的相似性配成对子或同一病人试验前后作配对,即自身对照。这种配对比较由于可比性好,偏倚小,所需样本量较小。
例用某药治疗矽肺病人,其尿矽排出量治疗前后对比时,治疗后的排出量平均增加1.5mg/ml尿,s=2.5mg/ml尿。假定该药确能使尿矽排出量增加,问二少须观察多少例病人才能使服药前后的尿排矽量的差别有统计学意义?(规定α=0.05,1-β=0.90)
本例为配对比较,差数的均数为1.5,s=2.5,δ=μ/σ=1.5/2.5=0.60。题意假定该药确能使尿矽排出量增加,故为单侧检验。查附表31-3,得n=26,即26对。但因此试验每个病人治疗前后即为一对,故也即26人。
四、效应指标
临床试验是通过研究因素在研究对象身上产生效应来验证或说明研究成果的。可以说临床试验基本的研究结果只有运用恰当兵指标才能表现出来。因此,试验设计时研究人员应掌握一些能反映效应的指标,如发病率、死亡率、治愈率、缓解率、复发率、毒副作用、体征的改变和实验室测定结果等。至于如具体选用哪些指标应考虑下述几方面。
(一)选择效应指标应注意的问题
1.指标的关联性选用的指标须与临床试验所要回答的主要问题有密切的关系,即所选用的指标与本次试验的目的有本质上的联系,称作指标的关联性。试验的目的不同,选用的指标亦不同。
例如比较强地松龙冲击加小剂量口服强地松与大剂量口服强地松两种疗法的疗效研究中,疗效制定指标为:①微小病变型肾病综合征的症状完全缓解;②反应时期:从开始治疗到缓解的第一天所需的天数;③复发;④病人有无初期反应(若无,则中断治疗和考虑其他疗法)。
在这项试验中使用统一的类固醇副作用判定标准作为评价副作用和合并症的指标。
随着医学的进展,某些现代效应指标可供选用,但它们未必能够确切地反映研究因素所引起的效应,解决试验所要阐明的问题。例如曾有人在筛选治疗冠状动脉血栓形成的药物时采用抗凝为指标。经实验后认识到抗血凝与冠状动脉形成血栓并无本质上的联系。
2.指标的客观性临床实践中,观察指标从性质上说可分为客观和主观指标两类。客观指标是指那些不易受主观因素影响的,并能客观记录的指标,如心电图、血管造影、化验数据和微生物培养等。主观指标是靠研究对象回答或研究人员自行判断而不客观记录的指标,如研究对象陈述某些症状(如倦怠、疼痛、食欲不佳等)或研究人员通过体检获得的结果。这些指标易受主观因素的影响,其可靠性明显地不及客观指标。还应了解到有些指标虽是客观指标,但主观因素却可影响判读结果。
在临床试验设计中,应尽量少用主观指标,因其易受研究对象和研究人员心理状态、启发暗示和感官差异的影响。必须采用时要注意其缺点。
3.指标的灵敏性灵敏的指标是指能如实地反映研究对象体内微量效应变化的指标。临床上,高度灵敏的指标是很多的。改进检测方法和研制新的仪器是提高指标灵敏性的主要途径。
4.指标的特异性特异的指标易于揭示问题的本质,同时又不为其他因素干扰,如痰中结核菌检出率是反映开放性肺结核疗效的特异性指标,也与可回答的主要问题密切相关。关联性和特异性是性质不同的两个概念,但特异性与关联性密切相关,而有关联性的指标并不一定的特异的。事实上临床实践中有不少指标就不是特异的,如胎儿血清甲种球蛋白在诊断原发性肝癌上有较大的价值,但它并不是一个特异指标。至于像血清血蛋白与球蛋白的比值、血沉、白细胞总数和分类等均非特异的,因为多种疾病都可使它们发生改变。但在患某种疾病时与其他指标联合使用,依然能反映上述疾病的进展过程。如在急性支气管肺炎时,综合考虑白细胞总数和分类、X线所见、体温等指标可反映病情的变化。
这样,近年来不少临床学家在评价疗效时倾向于使用多项指标加以综合评价,而不主张使用单项指标。
(二)指标的分类
按效应指标的不同性质可将之分为计数和计量指标两类。具体的内容见第四篇有关章节。
还有一类效应指标介于前两者之间,称作等级资料或半计量资料。这类指标按其属性系计数,但具有等级和连续性质。如在一项检验中为了显示机体的反应情况有时使用(-)、(±)、(+)、(++)、(+++)等符号即属于这类指标。
(三)指标的数量
一项临床试验中究竟要使用多少个效应指标?没有具体规定。这要根据研究工作的目的以及目前医学发展水平而定。由于人是一个复杂的有机体,患病后既有生物学上的改变,又有心理和社会学等方面的变化,效应可从不同方面表现出来。从这个意义来说,效应指标可有多种,但并非说使用的指标越多越好。可是指标的数量也不能太少,因为在设计时若出现差错或考虑不周将会降低研究工作的质量,甚至可使整个研究工作失败。
(四)增强主观指标客观性的方法
在这方面目前的主要方法是为了消除研究对象心理因素的影响将研究对象随机分组。为了克服研究人员主观因素的影响使对照组服安慰剂,观察时可采用盲法。
使用等级指标时,为了减少观察人员主观因素的影响,并使其有章可循,研究人员应对每个等级制订具体的,明确的判定标准。
(五)制订效应指标观察常规
试验设计阶段研究人员制订效应指标具体的观察方法,如观察标准、观察次数、各次间隔和观察期限,还应制订记录表格和登记方法。