临床试验的统计学设计与评价.docx
《临床试验的统计学设计与评价.docx》由会员分享,可在线阅读,更多相关《临床试验的统计学设计与评价.docx(5页珍藏版)》请在第一文库网上搜索。
1、临床试验的统计学设计与评价在循证医学框架下,确证性临床试验多采用随机对照设计,通常具有更高的证据等级,其结果也更有可能被领域指南所引用,进而将对应的诊疗策略传递到临床实践中。统计学方法在这一过程中起到重要作用,虽然以统计检验0.05作试验结论的依据受到诟病,但其仍是对临床试验结果做判断的关键参考。需要指出的是,统计学显著和临床显著间并不统一不,如果一项试验仅获得了统计学显著、但缺乏临床意义,这样的研究结果若被指南采纳并推荐,其对临床实践、患者权益和医疗资源投入都会造成严重的负面影响。试验设计阶段对预期效应值的假设,本身与统计分析阶段的统计学推断相关,前者决定样本量规模,后者则在方案设计的样本量
2、前提下确认观察效应值的统计学意义,所以两者具有天然的内在系。如果将试验设计阶段的预期效应值,与试验结果中获得的观察效应值相结合,不仅可以加强试验设计阶段对研究问题的理解,还可辅助判断试验结果临床意义的充分性。因此,本文就这一问题进行相应的介绍。一、试验设计阶段的统计学考虑用样本量设计代替样本量计算的表述更为合理,因为从技术角度样本量的计算仅是将给定的参数带入公式得到相应结果的过程,参数假设的适宜性包括方法选择的正确性就变得尤为重要,其背后的决定因素实际是研究方案中临床相关要素的设定,包括且不限于:研究的总体设计、研究假设、入选排除标准、主要指标及对应的评价标准等,任何临床要素的改变都有可能传递
3、至对预期疗效的假设(样本量计算时所需的参数),从而影响试验的最终规模,样本量确定过程中所涉及的关键要素见图1。图1研究设计阶段与样本量相关的临床要素样本量的确定实际是试验方案设计的终末环节,只有上述研究方案中临床相关要素均被确认后,结合预试验、文献或临床经验对预期疗效做出尽可能合理的假设,然后对样本规模进行测算。在确证性临床试验中(以验证特定药物、器械或诊疗策略等的安全性和有效性为目标),若聚焦样本量计算的具体参数,一般包括以下两个维度共计4个参数。1统计相关参数:显著性水平(SignifiCanCe1eve1)和把握度(POWer)是在确证性研究设计过程需要预先设置的统计相关参数。显著性水平
4、对应试验的假阳性风险,或理解为监管部门批准无效产品(结果因机会效应显示有效)上市、期刊发表无法重现的阳性结果(同样由于机会效应显示的阳性结果)的概率。显著性水平越严格、所需要的样本量越多,且在设置显著性水平的时候需要指明单侧或双侧,与拟开展的假设检验对应。需要注意的是,选择单侧0.025和双侧0.05的显著性水平,对应的正态分布分位数同为1.96,在计算样本量时具有对等性,方案阶段的显著性水平设置,也与统计检验时P值的阈值对应,如果因多重比较问题对显著性水平做了校正,比如设置了2个多重主要终点,将显著性水平调整为0.025,在最终分析时必须达到A0.025才算阳性结果。把握度可理解为试验成功的
5、概率,更严格地讲是当试验组真实有效时,当前试验能够将其验证的概率。把握度水平与样本量呈正比,设置更高的检验把握度需要更多的样本量。常规可通过把握度来计算样本量,也可以固定样本量反算把握度,对应试验设计阶段的把握度分析(POWeana1ysis)。显著性水平最高取0.05、把握度最低取80%是大多数临床试验的标准设定,所以真正决定试验规模差异的是接下来的临床参数。2.临床相关参数:样本量计算时所需的来自临床的参数包括效应值(effectsize)和变异度(variabi1ity),可以通过标准化差异的方式将两者整合(组间差异变异)。所谓的标准化差异可理解为主要指标在组间的差异程度,也就是目标效应
6、值(targeteffectsize)0标准化差异与样本量呈反比,预设的组间差异越小所需的样本量越大,预期的组间差异越大计算得到的样本量反而越小。目标效应值的设定,往往基于预试验结果、相关领域的参考文献或临床经验判断。预期效应值的准确假设,对试验至关重要。因为过于保守的预期疗效假设将导致不必要的样本量增加,最终检出的过小的组间差异也可能缺乏临床意义,而且让更多患者暴露在试验的不确定性风险下也有伦理问题。同时,过于乐观的预期疗效假设也是不推荐的,过大的组间预期效应值虽然能够将样本量控制在可行性的范围,但如果试验结果中观察到的实际组间差异(观察效应值ObSerVedeffectsize)远低于目标
7、效应值,最终将由于样本量不足导致阴性结果。所以对目标效应值的预估和假设需要更加综合的考虑,而且如前所述,研究中的纳入及排除标准、评价指标等的变化,都有可能传递到预期组间差异的变化,从而影响到样本量以及最终的试验结果。二、统计分析阶段的统计学考虑在对临床试验数据统计分析时,通常会借助统计检验辅助做出结论,但此时往往不再需要借助假设检验中备择假设的信息,仅以试验样本数据在原假设分布下对应的尾概率(P值)做推断。如前所述,此时的推断标准,与是否具有临床意义不存在任何关联。以优效性比较为例,如果在假设检验中引入界值,虽然能够保证所获得的阳性结果具有临床意义,但因为要求组间差异的置信区间不能包括界值,除
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 临床试验 统计学 设计 评价