横断面调查中的样本量计算

 

本文主要介绍一下横断面研究中的样本量计算。...



横断面研究大多是为了调查某疾病的发生率,其样本量的计算需要考虑该疾病的预期发病率,并指定调查的精确度d(研究者容许的偏离总体值的程度)。通常精确度有两种指定方式,一是指定固定的精确度(如0.1、0.05等),二是根据预期发病率指定精确度为发病率的百分比(如预期发病率为20%,精确度为预期发病率的10%即2%)。

除上述因素外,横断面调查还需要根据抽样方式考虑设计效率(design effect,Deff)的问题。设计效率值是指对于同一目标量,调查单位相同时,所考虑的抽样设计估计量方差与完全随机抽样设计(不放回)估计量方差的比值。设计效率值越大,所考虑的抽样设计的误差越大,表明该设计的效率越低。此时要想达到跟完全随机抽样相同的效率,就需要更多的样本量

一般来说,整群抽样的设计效率值较大,多数专家建议为2(也有的建议为3),即对于整群抽样,至少需要2倍的样本量,才能达到与完全随机抽样相同的效率。

(1)当指定固定的精确度d时,样本量计算公式为:



式中,Z1-α/2为标准正态分布下面积为1-α/2所对应的百分位数,常见的是取α=0.05,此时对应的Z1-α/2为1.96。d2为容许偏离的误差,即精确度。p表示预期发病率,如果容许误差固定的话(如设定d =0.05),p(1-p)越大,计算的样本量就越大,不难看出,p =0.5时,p(1-p)最大。所以如果容许误差固定,当不了解预期发病率时,可以p =0.5计算样本量,此时计算的样本量最为保守。但要注意仅限于容许误差固定的情况。

(2)当指定预期发病率的百分比作为精确度时,样本量计算公式为:



式中,Z1-α/2为标准正态分布下面积为1-α/2所对应的百分位数。p表示预期发病率。ε为预期发病率的百分比。这种情况下,预期发病率越低,所需样本量越大;预期发病率越高,所需样本量越小。所以需要事先获得预期发病率,否则无法计算。

1某卫生机构欲估计当地儿童接受规定疫苗注射的比例,采用随机抽样的方法,研究者欲以95%的可信度,要求结果与总体真实比例的偏差不超过5%。共需调查多少儿童?

该研究未获得当地儿童注射疫苗比例的预估值,由于α=0.05,Z1-α/2=1.96,d=0.05。为了保证样本量足够,设p=50%进行计算。计算结果如下:

即共需调查385人,才能保证结果的偏差不超过5%。

2某研究欲调查当地学龄儿童的龋齿患病率,为了调查方便,采用整群抽样的方法。研究者根据以往资料发现当地学龄儿童的龋齿患病率约为30%,现欲以95%的可信度,要求结果落在总体真实率的10%以内。共需调查多少儿童?

该研究中,p=0.03,ε=0.1,α=0.05,则Z1-α/2=1.96。计算结果如下:

对于整群抽样,通常需要考虑设计效率的问题,即通过上式计算出897例之后,还需要乘以设计效率值才能达到与完全随机设计一样的效率。假定设计效率值为2,则采用整群抽样需要897*2=1794例。


    关注 小白学统计


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册