医心网  >  医心杂志  >   正文

临床试验多终点问题的统计学考虑

发布于:2014-11-12 09:18    

编者按:在循证医学大发展的时代,临床研究作为推动医疗新技术发展、器械优化、更新等过程中不可缺少的环节早已不为陌生,但咎其细节,期间却又蕴含诸多专业性知识,其决定着一项临床研究的“成功”与否。而多年的临床研究发展告诉我们,所谓“成功”与“优秀”的临床研究也绝非为了获取某一特定的终点或目标而进行数据、信息等的“迎合”;相对地,其需要在严谨的临床方案设计基础上,以患者为本,运用科学的方法,并结合临床实践,不断调整,相辅相成,以此达到良性循环。因此,这也是医心团队希望在每一年的期刊中,整合一些有关临床研究方法学及临床研究实践应用等的文章,与广大医师分享与“再学习”。本期“临床研究”专栏中,将从“临床试验多终点问题的统计学考虑”、“随机对照研究设计与要点”、“真实世界中的多因素分析”等文章中探讨临床研究基础方法学中的细节,并结合“起搏器电极导线拔除风险评估及经验总结”一文,观察我国心脏器械治疗临床应用之一隅。

 
文 / 王杨   国家心血管病中心阜外医院

王杨 国家心血管病中心阜外医院;高级统计师,国家心血管病中心、医学研究统计中心统计总监。比利时鲁文大学、美国杜克大学访问学者。SFDA 药物及器械审评特聘统计专家,参与并起草 SFDA多项产品临床试验指南。具有临床研究及生物统计领域 10年工作经验,主要致力于实验设计及临床试验相关的统计方法学研究。在同行评议期刊上发表方法学文章 6 篇(第一作者)。


多终点导致的问题

 
在一项临床试验中,研究者出于对有效性和安全性进行观察和评价的考虑,通常会设置多个观察指标,这些指 标有些对应患者接受干预后的治疗效果、或对应与治疗相 关的副反应以及最终的临床结局,为方便表述,在此将上 述提及的观察指标都统称为终点指标。多终点问题实际就 是在对多个(≥ 2 个)终点同时进行统计检验时,导致的 I 型误差膨胀问题。本文将就临床试验多终点问题的统计 学考虑做一概述。

 
图 1 直观地给出了试验的 I 型误差水平随终点数量增 加而增加的情况, I型误差也称为“犯假阳性错误的风险”, 即当原假设为真时(治疗无效)、但却错误的将其拒绝(当 前试验由于抽样的机会效应、错误的显示其有效)的概率。 法规监管部门和临床研究者都希望尽可能降低犯该错误 的风险,在研究设计时将统计检验的显著性水平限制在 0.05 或更低水平的原因正是出于这一考虑。


为了避免 I 型误差膨胀的问题,与其他多重比较问题 类似,通过对总体的 I 型误差进行控制是较常用的方法。 假设在一项临床试验中共有 4 个主要终点,研究者期望 在这些指标中有任何一个达统计学显著,就认可所研究 治疗方法的效果。为了控制总体 I 型误差不超过 0.05,就 需要限制每一终点指标在分别检验时的显著性水平,例 如 0.0125(0.05/4),等于将总体的误差水平平均分配 给了各个指标。该方法最直接的效果是增加试验样本量, 当预检出 0.5 个单位的标准差异时,如果仅有 1 个终点 指标、在显著性水平取0.05时需要的样本量为63例每组, 但是在有 4 个终点指标时,预检出同样的标准化差异、 所需的样本量每组至少为 90 例(增加的原因是显著性水 平设置在 0.0125)。


多重终点及共同终点

 

通过在多重比较中直接控制 I 型误差,是多终点临床 试验的经典方法。与之相比,共同终点的设计方式、尤其 在确证性试验中也被广泛使用。共同终点(Co-endpoint) 在定义上虽和多重终点(Multiple-endpoint)类似,都是在 一个试验中去观察多个终点指标,但在试验设计和结果判 定上却存在明显的不同,在共同终点试验中,必须要求所 有设定的终点指标都同时获得“阳性”结果,试验方可认 为成功;而反观多重终点设计,只要求多个终点指标中的 任何一个“阳性”,就认为试验成功。图2清晰地给出了 两方法间的区别。 

 

有学者从统计学角度将多重终点问题定义为“并 - 交 检验”,而与之相对应、共同终点的情形则被定义为“交- 并检验”。其实可把两种情形分别形象的理解为物理学 中的并联或串联电路,多重终点由于仅要求任何一个终 点达到显著,就像并联电路中任何一条通畅整体即可联 通;而共同终点则必须要求所有终点都显著,所以相当 于串联电路中所有节点都须通畅时整体方能联通。

 

正是由于在结果判定上的差异,所以共同终点试验在 设计上与多重终点也存在根本差异,之前介绍过的多重终 点问题是通过对 I 型误差的直接控制,来避免由于对多个 终点指标进行检验而导致的犯假阳性错误概率增加的问 题。在共同终点试验中:首先需要在样本量计算时分别对 每一个终点指标进行计算;然后取多个终点指标对样本量 要求最大者作为试验的最终规模;在对每一个指标进行样 本量计算时,无需调整 I 型误差水平,这一点与选取所有 指标对样本量要求最大者进行研究、以及在结果判定时要 求所有指标都达到阳性才认可试验结果是对应的。

 

对 I 型误差的控制是临床试验中关键的统计学问题, 多重终点的试验通过直接控制 I 型误差,但同时用相对大 的样本量来解决问题,但其获益为多个终点指标中的任 何一个达显著即成功;另一方面,共同终点试验不需要 对 I 型误差进行直接进行调整,仅需按照多个终点指标中 对样本量要求最多的进行试验即可,但从结果评价角度 则必须所有的终点指标都满足要求才可认为试验成功。 对于在多重终点情形下如何选择合理的 I 型误差控制方 法、以及在共同终点情况下需要注意的问题,建议在试 验方案设计阶段就与专业的临床试验统计方法学家进行 充分的讨论和沟通,以降低临床试验可能面临的风险。

 

来源于:《医心评论》2014年04期



上一篇:Ⅰ型心肾综合征的四个风险预警系统 ——访安贞医院肾内科谌贻璞教授
下一篇:起搏导线拔除风险评估与经验总结
评论列表:(评论 0 )以下网友评论只代表网友个人观点,不代表本站观点。
最短5个字
登录     注册