谈临床试验中的非劣效试验

发布于:2013-10-18 17:23

编者按：非劣效试验仅需要证明试验产品不差于对照产品。临床试验中想获得非劣效结论具有特定的方法及流程，如果想证明一个新治疗方法与对照方法同样有效，需要先明确两治疗方法间能够被接受的具有临床意义的非劣效界值。非劣效界值是非劣效试验中最关键的概念。同时，非劣效试验中还存在着很多研究者必须注意的问题，需要临床专家与统计师通力合作，以便为临床试验的成功提供保证。

文/ 王杨国家心血管病中心阜外医院

王杨　国家心血管病中心阜外医院高级统计师，国家心血管病中心、医学研究统计中心统计总监。比利时鲁文大学、美国杜克大学访问学者。SFDA药物及器械审评特聘统计专家，参与并起草SFDA多项产品临床试验指南。具有临床研究及生物统计领域10年工作经验，主要致力于试验设计及临床试验相关的统计方法学研究。在同行评议期刊上发表方法学文章6篇（第一作者）。

非劣效设计在临床试验中变得越来越普遍，与传统的差异性检验（优效设计）相比，在非劣效试验中仅需要证明试验产品不差于对照产品即可（这里产品可以指药物或医疗器械）。非劣效试验不断增加的原因在于，随着医学研究的快速发展，目前对于很多疾病而言，已存在明确有效的治疗方法，在已经明确有效的治疗方法基础上，再进一步的显著提高疗效变得非常困难。另一方面，安慰剂对照试验虽然能够更明确地验证新产品的效果，但是出于伦理学考量，安慰剂对照往往不可行。所以，以阳性治疗方法作为对照组的非劣效试验逐渐增多。

从概念上看，非劣效试验中仅需要证明试验产品的安全性和有效性与对照产品相当。临床试验中想获得非劣效结论有特定的方法，ICH指导原则指出：通过组间检验P值大于0.05而做出试验组非劣效于对照组的结论是错误的（这一点往往被国内的研究者所忽略）！如果想证明一个新的治疗方法与对照方法同样有效，需要先明确两治疗方法间能够被接受的最大差异水平。这个差异水平被叫做“非劣效界值”，非劣效界值必须具有临床意义。例如，对照组的有效率为90%（有效率越高越好），如果试验组产品的有效率仅为80%，那么从临床角度判断，是否还能认为两组的疗效相当？如果对于特定的疾病和治疗方法，临床医生认为试验组与对照组相比，有效率相差只要不超过10%（比对照组低），仍可认为试验产品不比对照差，那么就可以将非劣效界值确定为10%。实际上，非劣效界值有着实际的意义，如果在非劣效界值为10%的前提下，证明了新的治疗方法非劣效于对照方法，那么今后临床医生在采用该新方法对患者进行治疗时，每治疗100个患者，将有可能比使用传统方法治疗，多增加10例的无效患者。如果从这一实际意义的角度考虑，超出的无效患者比例不能被接受，反过来则说明所制定的非劣效界值过宽，将不合理的界值进行修正的方法就是缩小非劣效界值（减小组间能够被接受的最大差异水平）。

一般非劣效试验的流程为：1) 在研究方案中预先指明非劣效界值；2) 估计试验组和对照组间分别的疗效水平；3) 统计学显著性水平一般取双侧5%，把握度最低取80%；4) 在研究完成对数据进行分析时，需要给出试验组和对照组组间差异的95%置信区间，如果置信区间的上限小于非劣效界值，则可得出非劣效结论（低优指标是这一判断标准，低优指标指终点结果的数值越小越好，例如死亡率；而本文之前例子中给出的有效率则为高优指标，高优指标判定非劣效结论是否成立时，需要关注组间差异95%置信区间的下限是否大于非劣效界值）。如果组间差异的95%置信区间将非劣效界值包括在中间，此时则不能得出非劣效结论，说明两比较组之间可能出现的最大疗效差异，超过了临床上能够接受的最大幅度。

非劣效试验虽然仅需证明试验组不差于对照组（不需证明比对照好），但不代表非劣效试验中需要的样本量小于优效试验。决定非劣效试验样本量大小的因素包括：非劣效界值、试验组与对照组的预期疗效、统计学显著性水平及把握度，其中最为关键的就是前文讨论的非劣效界值。通常，非劣效界值越小（越严格），试验所需要的样本量越大，非劣效界值越宽（能够接受的组间差异越大），试验所需要的样本量则越小。

非劣效试验中还存在很多研究者必须注意的问题，例如，确定界值时需要结合既往安慰剂对照试验（当前非劣效试验中的对照组与安慰剂进行的试验）的结果，在获得非劣效结果后是否可以进一步进行优效性推断，全分析人群和符合方案人群的结果在非劣效试验中哪个更合理，以及非劣效试验中的退化问题等。总之，非劣效检验不同于传统的差异性检验，在设计和结果解读时都有其相应的特定方法，非劣效试验中最为关键的概念就是非劣效界值，其关系到研究的样本量规模以及最终是否能够得到非劣效的结论。在整个过程中，需要临床专家与统计师通力合作，以便为临床试验的成功提供保证。

来源于：《医心评论》第66期

上一篇：中国临床实践指南制定的现状与建议

下一篇：meta分析的统计学问题

相关文章: