返回目录:excel表格制作
话说,不!应该是……
胡说,东汉末年,天下三分,“懒癌”流行。
一
这一日,曹丞相召三国肿瘤登记中心吉平太医,咨询迁都事宜:只因许都“懒癌”高发,民怨颇多,听闻邺城环境好,没雾霾,无“懒癌”,是否属实?
吉太医立即汇报:根据最新的年度“懒癌”发病统计,许都一年新发“懒癌”426例,同年邺城新发86例。
曹操大惊:那还了得,速速传我命令,迁都邺城!
吉太医连忙制止:丞相且慢!我许都有人口34万,而邺城仅区区6万也。
曹操道:此话怎讲?
吉太医道:小吉也曾师从郑玄,精通算学,待我取出算筹,演算一番。
记
许都病例数为c1=426,
人口数为n1=344,627,
发病率为p1=c1/n1=
426/344,627×100,000=
123.61/10万;
邺城病例数为c2=86,
人口数为n1=60,834,
发病率为p2=c2/n2=
86/60,834=141.37万;
p1<p2,
可见虽然许都的“懒癌”发病例数很大,但发病率其实比邺城还要小。
二
曹操:原来如此,只看绝对数,不看相对数,险些误我大事。如若贸然迁都邺城,岂不是白白劳民伤财,还把百姓生生地往火坑里推。
吉太医:哪也未必!
曹操:何以见得?
吉太医:2个样本率的比较,不是玩纸牌比大小,还需要统计学检验,看看是否仅仅是巧合。
曹操:此话有理,速速算来!
吉太医:2个样本率比较常用Z检验,也叫u检验。
先求2类人群的合计率
再求出标准误
那么统计量
|p1-p2|是对2个率值之差取绝对值。
在Excel中,开平方根的公式是sqrt();
取绝对值的公式是abs()。
因此,上述公式在Excel中的实现形式是
Z=abs(c1/n1-c2/n2)/sqrt((c1+c2)/(n1+n2)*(1-(c1+c2)/(n1+n2))*(1/n1+1/n2))
接下去就可以判定P值了:
当a=0.05, Z0.05=1.96;
a=0.01, Z0.01=2.58;
当Z<Za,P>a;
Z>Za, P<a。
这里的Z=1.137<Z0.05的界值1.96,
因此P>0.05,
不能认为许都和邺城的懒癌发病率之间的差异有统计学意义。
三
曹操:求出P就好,求出P就好啊!看来老夫也没看错邺城。不对呀,为什么人家的报告里都用卡方检验,你哪里整出个莫名奇妙的Z检验出来的?
吉太医:我也是老师怎么教就怎么用,不过自己也尝试过,2种方法似乎并无二致。
建立四格表
当a=0.05, χ20.05=3.84;
a=0.01, χ20.01=6.63;
计算公式是
在Excel里更容易实现;
这里得出χ2=1.293<χ20.05的界值3.84,
因此P>0.05,
也不能认为许都和邺城的懒癌发病率之间的差异有统计学意义。
曹操:这2种方法的结果总是一致吗?
吉太医:如果观察病例数不是小到要用确切概率法的卡方检验,那么2种方法的结果总是一致的。
其实上述的
Z2=1.1372=1.293=χ2;
Z20.05=χ20.05;
Z20.01=χ20.01。
曹操:这是为什么呢?
吉太医:凡发病、死亡或患病与否,类似“成-败型”试验,或称Bernoulli试验,常称“不努力”或“布努力”,其概率分布为二项式分布,当率不接近0也不接近1,n又较大时,根据中心极限定理,是近似正态分布的。
当n很大而率很小时,二项式分布可近似泊松(Poisson)分布,而Poisson分布也常近似正态分布。
卡方检验则是通用性……
曹操:好了好了,老夫已经晕菜了。
就问你刚说的“不接近”、“较大”、“很大”、“很小”有标准吗?
吉太医:有说n>30的,有说n>50的,对于以人群为基础的肿瘤登记工作来说,都是以庞大的人口基数为n的,因此平时都不大考虑。
四
曹操:那平时就用四格表的卡方检验好了,大家都看得懂啊?
吉太医:首选还是Z检验为宜,公式中有求率p的过程,比较容易理解。
求率值时,以人口基数为分母,也得到了普遍的认同。
但是四格表如果列出“未发病”,其实就错了,因为其中还有老病人未扣除,所以要理解成“新发病”和“非新发病”,如此种种不便于理解。
曹操:好了,好了!说得我已经头痛了,赶紧写成告示,张榜安民吧!
吉太医:恐怕这笔账还没算完!
曹操:又待怎讲?
吉太医:对普通百姓而言,直接2个率比较一下,也就不吭声了。
做临床医生和/或搞过点科学研究的,可能要看到有统计学检验和P值才能服气。
如果让正在游学东吴的华佗医生看到,说不定要写评论信给《三国医学》、《三国肿瘤》和《三国癌症》等有名的期刊杂志,指出其中的不科学,毕竟人家也学过流行病和统计学。
曹操:怎么不科学?说来听听。
吉太医:2类人群率的比较还要考虑人群不同特征结构上的差异。
比如女儿国就唐僧师徒4个男的那种状态时,全国人长胡子的概率就太低了,需要性别标准化。
“懒癌”明显岁数越大越容易得,就需要年龄标准化。
当然标化率在进行比较时,也要选择适宜的统计学检验方法,可以应用加权卡方检验法(Cochran法),先算标化率的标准误SE……
曹操:哎呀!头好痛!!头好痛!!改日再议!!!改日再议!!!
本文是春晓医生参与肿瘤登记项目的心得体会,所有文字仅代表个人观点,用于分享交流。
欢迎参与和关注本项目的同行留言,您的想法和建议,将有助于工作的开展。