医心网  >  临床研究  >   正文

简要理解“统计描述”

发布于:2014-08-13 17:43    

临床研究往往会得到很多数据,然后呢,我们需要对数据加以统计处理。目的是啥?就是通过对数据的汇总去了解研究结果。在实际研究中,往往在开展临床研究之前,我们心中多少对研究结果都有估计,而且大部分是准的。为什么呢?因为这个领域你熟悉啊,你每天看这么多病人,多少有点儿感觉吧,只是这种感觉没有确切的数据加以表达而已。


既然开展了定量的研究,靠感觉去说服别人是不太合适了。所以我们需要用数字去说话,这样我们就需要从众多研究对象的测量数据中提炼出他们的共同特点。当然如果你的研究只有3个人,哪还有必要提炼吗?我觉得就甭费那劲了,直接把三个人的数据都写在文章里,读者应该不会看得一头雾水,反而一目便可了然3个人病人某指标的全部3个数据。哈哈,这是开玩笑啦,不过现实也的确是这样。


在临床研究中我们往往会有很多研究对象的数据,很多。那么这时候我们就需要对这些数据进行一定的统计描述。何谓统计描述,就是用统计的方法对数据进行一定的汇总。提到统计描述,不得不提统计推断,何谓统计推断呢,就是用概率论的方法对数据间的差异“是否有统计学意义”进行一定的推断,也就是我们常说的统计学检验(如t检验、卡方、方差分析等等)。


统计描述既然是对数据的汇总,那么我们应该怎么对数据进行汇总呢?从研究者的角度想,他应该想知道这些研究对象之间某指标的值是不是都一样,如果一样那么大概在什么水平上,如果不一样那么大家之间的差别有多大。分解一下,首先是某指标的值大概在什么水平上,这就是数据的集中趋势描述,也就是所谓的平均水平描述;其次是不同人之间的值变化情况如何,这就是数据的离散趋势描述,也就是所谓的大家之间差别大不大。



集中趋势描述,也就是大家的平均水平,如果是你,你会怎么干?我想大部分人都会选择取均值,的确这是对的。但是有一些特殊的情况,就是如果存在一些特例怎么办,就是个别人的值比较大,但是大的值又不多。也就是说数据不符合正态分布,这时候取平均值就会出问题,个别较大的数就会把平均水平“错误”的拉大,那么我们合适的做法是去中位数。什么叫中位数,就是由小到大排排坐,坐中间那个数就是。那么有人问,如果是12个数呢?没有中间,那你就把排在第6和7位的数算个平均。


说到均值,可不能小瞧它。均值分为算术均值和几何均值,我们常用的是算术均值,就是先加起来再除以总数量。几何均值呢,就是大家乘起来再求总数量次方根,它适用于值的变化范围跨越多个数量级的情况。



好吧,再来说说离散趋势描述。离散趋势就是反映大家之间的差别有多大的,常用的指标是标准差和四分位数间距。标准差是方差的算术平方根,方差怎么算的,分三步:1求所有的值与均值的差,2把这些差值求平方,3将这些平方的结果求均值就是方差。从计算的过程,你可以看到其实方差就是“离均差平方和的均值”。当然上面的算法是总体方差的算法,那么如果用样本方差的方差去估计总体的呢,只需要在求均值是不除以(总数量),而除以(总数量-1)。


那么四分位数间距又是什么呢,它跟中位数一样需要排排坐。就是拿排在第75%位置的数减去排在第25%位置的数。其实中位数就是排在第50%位置的数。


来源于:北医三院临床流行病和循证医学中心





上一篇:临床研究中常用到的专业术语
下一篇:临床研究的四个基本特征
评论列表:(评论 0 )以下网友评论只代表网友个人观点,不代表本站观点。
最短5个字
登录     注册