非劣效试验解释:该试验设计如何被使用及误用
发布于:2011-07-29 15:30
编者按:临床试验是探索和确证研究药物在特定适应证人群安全有效性的重要研究方法,主要有优效性试验和非劣效性试验,前者是经典的临床试验,旨在证明新的治疗方法优于安慰剂或标准治疗方法,而后者旨在证明新的治疗方法在可接受的范围内并不比标准治疗方法差。在临床上,很难证明新的治疗方法优于阳性对照组,因此非劣效试验应用广泛。那么对于非劣效性试验的设计如何被使用和误用呢? CIT 2011第三届临床研究专题研讨峰会上,阜外心血管病医院防治中心生物统计部李卫教授就这方面问题给大家做了详细介绍。
根据临床试验目的,通常可将临床试验分为优效性试验(Superiority Trial)、等效性试验(Equivalence Trial)和非劣效试验(Non-inferiority Trial)。
优效性试验是新药疗效探索和确证性试验中最为普遍应用的设计。其主要研究目的是显示试验组疗效优于对照组(安慰剂或阳性对照)。设T 为试验组疗效,C 为对照组疗效,下同。那么优效性试验的假设检验如下:
原假设H0:T-C≤0,备则假设H1:T-C>0。
统计推断:若P < 0.05,按单侧α=0.05 的检验水准,拒绝H0 假设,可认为试验组的疗效显著优于对照组。
非劣效试验的研究目的是显示试验组的疗效非劣于对照组,即试验治疗不比标准治疗差Δ,此处的Δ 是临床上可接受的试验组与对照组疗效差别的最大值。
原假设H0:T-C<-Δ,备则假设H1:T-C≥-Δ。
统计推断:若P < 0.05,按单侧α=0.05 的检验水准,拒绝H0 假设,可提供很强的证据说明试验治疗不比标准治疗差Δ。也可用可信区间法对非劣性做出判定,按单侧95% 可信度计算出T-C 可信区间(Confidence Interval,CI)的下限CL,若[CL , ∞ ] 完全在[-Δ,∞ ] 范围内,或者CL > -Δ,可下非劣效性的结论。如图1 中,A,B,D 可信区间的下限均大于-Δ,显示为非劣效性,甚至D 显示出优效性,而C 不支持非劣效假设。
图1
可见,非劣效临床试验相对于优效性临床试验而言,试验的设计、实施以及结果的分析都相对较难,但非劣效设计在国内新药临床研究中被普遍应用,其主要原因概括如下:
(1)若选择已上市的药物或标准治疗方法作为对照,试验组的疗效超过阳性对照组的可能性很小,采用优效性试验有较大风险。
(2)与上市药物或标准治疗相比,预计其疗效相当,但研究的新药或疗法在其他方面具有一些优点,如更加安全、使用方便、不会产生耐药性、副作用少、价格较低等。
(3)出于伦理的考虑,由于市场已有确切的安全有效的药物或治疗手段,安慰剂的对照试验不被接受,需要选择阳性药物或标准治疗来证明试验组非劣于对照组。
近年来,由于安慰剂对照试验受到伦理学方面的限制,以及阳性药物的大量存在,使得非劣效试验得到了广泛的应用,但是,由于没有一个完善的指导原则,一些非劣效试验设计存在着包括阳性对照选择错误、界值的确定不合理等诸多问题,导致非劣效设计被误用。所以,在应用非劣效设计时,应对以下问题提起注意。
阳性对照的选择
在非劣效试验设计中,阳性对照的选择应遵循“疗效确切,齐同可比”的原则。合适的阳性对照应是当前被广泛接受的阳性药物或标准治疗,其疗效得到了设计良好的临床试验的证实,具有较好的预测性和可重复性,并且对照组的主治功效、适用范围应与试验组类同。
但是在阳性对照的疗效不能得到充分保证的情况下,使用非劣效试验设计是不合理的,此时应增加必要的安慰剂对照,即采用包含试验组、阳性对照组和安慰剂对照组的非劣效试验设计,也就是所谓的“三臂试验”(3 Arms Trial),国外许多学者将此种非劣效试验设计视为“金标准”。
若阳性对照的选择不合理, 则容易导致“ 比较测定频率漂移”(Comparator “Degradation” o“r Creep”)现象的发生,即在非劣效试验中选择了一个疗效较差的药物作为对照,使得做出的上市药物疗效较差甚至没有安慰剂有效的一种现象。如图2 所示,以再狭窄率作为评价支架的主要疗效指标,第一代支架(DES-1)显著优于裸支架(安慰剂组)。DES-2 选DES-1 作为阳性对照,非劣效成立,如此后一代与前一代支架做非劣效临床试验,虽然DES-4 非劣于DES-3,但由于DES-3 的疗效并不优于裸支架(BMS),使得DES-4 甚至没有安慰剂有效。
图2
非劣效界值的选择
从临床意义上确认药物的疗效,需要事先确定评价的界值。在非劣效试验中的界值是指临床上能够接受的试验药物和阳性对照药物之间疗效相差的最大值。ICH E10建议,非劣效界值需要在统计学和临床上共同确定,且相对保守,应该小于阳性对照药物在历史安慰剂对照的优效性试验中所观察到的疗效差值。
由于界值的确定是建立在阳性药历史对照的优效性设计的基础上,因此阳性药的选择以及文献的充分支持都是非常关键的,对文献的全面收集和分析是必不可少的。
样本量的确定
在临床试验中,正确的估计所需样本含量,是保证该试验有足够的把握度得到预期阳性结果的必要条件。
当主要疗效指标是定量变量时,假设单侧检验水准为α,把握度为1-β,在两组总体均数相同T=C 的条件下,非劣效试验每组需要的样本含量为:
其中,Zα 和Zβ 均为标准正态离差的单侧界值;σ 为两组的合并标准差;Δ 为非劣效界值。
当主要疗效指标是定性变量时,假设单侧检验水准为α,把握度为1-β,在两组总体率相同T=C=π 的条件下,非劣效试验每组需要的样本含量为:
在试验设计时,要保守地估计非劣效界值。由于样本量与界值成反比,界值越大,样本量越小。不能为了减小样本量而采用过大的界值,否则会导致试验把握度过低,无法得到非劣效结果。
值得注意的是,优效性试验的样本量公式与非劣效类同,差别仅在于优效性试验的分母不是Δ2,而是δ2,δ为估计的组间疗效差值。由于非劣效界值Δ 应小于δ,非劣效试验所需的样本量远大于优效性试验。因此,当非劣效试验的非劣效假设成立时,可进一步做优效性假设检验,反过来,若优效性假设不成立,由于样本量过小,没有足够的把握度得到非劣效的结果,不能进一步做非劣效分析。
综上所述,当要研究的新药或新治疗方法在疗效上与阳性对照相当,但在其他方面有一些优点时,我们可以使用非劣效设计。但应用此设计方法时,应谨慎选择阳性对照组,合理确定非劣效界值,准确估计样本量,还要严格加强临床试验的质量控制,保证非劣效试验的顺利进行。(李卫 唐欣然 阜外心血管病医院)
文章来源:《医心评论》
来源: 医心杂志



京公网安备 11010102002968号