横断面研究(cross-sectional study)是通过对特定时点和特定范围内人群中的疾病或健康状况和有关因素的分布状况的资料收集、描述,从而为进一步的研究提供
病因线索。它是描述
流行病学中应用最为广泛的方法。
概念
横断面研究又称
横断面调查,因为所获得的
描述性资料是在某一时点或在一个较短时间区间内收集的,所以它客观地反映了这一时点的
疾病分布以及人们的某些特征与疾病之间的关联。由于所收集的资料是调查当时所得到的现况资料,故又称
现况研究或
现况调查(prevalence survey);又因横断面研究所用的指标主要是
患病率,又称
患病率调查。
目的
1.描述疾病或健康状况的
三间分布情况 通过对某一地区或人群的调查,获得某种疾病在时间、地区和人群中的分布,从而发现
高危人群或发现有关的病因线索,为疾病的防治提供依据。
2.描述某些因素或特征与疾病的关联,确定
危险因素 如通过对冠心病及其危险因素的调查,发现
高血压、
高血脂、超重、吸烟及有关职业与
冠心病的关系,从而为降低危险因素、减少冠心病发生提供依据。
3.为评价防治措施及效果提供有价值的信息 如在采取措施若干时期后,重复进行横断面研究,根据患病率差别的比较,可以考核前段时期所施行措施的效果。
4.为疾病监测或其他类型
流行病学研究提供
基础资料。
用途
1.描述疾病或健康状况的分布。
2.评价一个国家或地方的健康水平。
7.用于检查和衡量既往资料的质量。
分类
普查
我国开展普查工作有较丰富的经验。对
肿瘤、
心血管疾病、
甲状腺肿、
乙型肝炎、
结核病等都进行过大规模的普查工作。其中有些疾病通过
早期治疗与反复防治已得到控制或
基本控制,取得了显著的成果。
普查的主要目的是为了早期发现病例并给予及时治疗。普查的疾病最好是患病率比较高的,以便短时间内调查能得到足够的病例。
普查由于是调查某一人群的所有成员,所以在确定调查对象上比较简单;而且所获得的数据可以了解疾病的三间分布特征,因此对疾病的
流行因素能有一定的启示。
但普查不适用于病程短、患病率低或检查方法复杂的疾病调查。由于普查对象多,难免漏诊、误诊;因参加普查的工作人员多,掌握调查技术和检验方法的熟练程度不等,调查员质量不易控制;同时由于工作量大,很难进行深入细致的调查。
抽样调查
在实际工作中通常是从总体中随机抽取部分
观察单位(统计学上称为样本)进行调查称为抽样调查。抽样调查是根据抽取样本所调查的结果来估计出样本所代表总体的某些特征,因此抽样调查必须遵循随机化原则,才能获得较好
代表性样本。抽样调查可以节省人力、物力、时间。因其调查范围小,故调查工作易做得细致。但抽样调查的设计、实施与资料分析较复杂,重复和遗漏不易发现,不适用于变异过大的研究对象。
常用的随机抽样方法如下:
1.
单纯随机抽样(simple random sampling) 即先将
调查总体的全部观察单位编号,再用
随机数字表或抽签等方法随机抽取部分观察单位组成样本。
在横断面研究中,因调查的观察单位太多时,很难将全部观察单位编号,故使用单纯随机抽样的机会不多,但它是实施其他
抽样方法的基础。
2.
系统抽样(
systematic sampling) 又称
等距抽样或机械抽样。即先将总体的观察单位按某一
顺序号分成n个部分,再从第一部分随机抽取第K号观察单位,依次用相等间隔,机械地从每一部分各抽一个观察单位组成样本。
例1 欲了解某单位职工HBSAg阳性率,该单位有职工1000人,试按
系统抽样法,抽取一例数为100的样本。
今总体例数N=1000,样本例数=100,抽样间隔=1000/100=10,先在1
-10之间随机确定一个数字,比如为4,于是以职工
工作证号4,14,24,34,…,994者组成样本。
3.
分层抽样(stratified sampling) 又称
分类抽样。即先按影响观察值变异较大的某种特征,将总体分为若干类型或组别(统计学上叫“层”,Strata),再从每一层内随机抽取一定数量(可按比例或
最优分配确定)的观察单位,合起来组成样本。
例如,先将欲调查的总体按年龄、性别或疾病
严重性等特征分成不同层次,在各层再作随机抽样。分层抽样可以减少由各层特征不同而引起的
抽样误差。
例如,作
钩虫病调查时,抽查某县的几个乡的全体乡民。作计划生育调查时,抽查城市里几个居委会的全部居民。
因抽样调查是从总体中随机抽取部分观察单位作为调查对象,所以抽样调查不可避免产生
抽样误差,抽样误差的大小因
抽样方法不同而异,一般情况下,抽样误差从小到大的顺序为分层抽样、系统抽样、
单纯随机抽样、整群抽样。
样本设计
求估计总体
均数(或率)所需样本例数n的方法如下(作
假设检验时,n的估计方法详见实验设计)。
1.均数的抽样 对于
计量资料,欲估计总体均数时,可用公式估计样本例数
n=[(tαs)/d]2 (15-1)
式中n为样本例数,d为
允许误差,即
样本均数与总体均数相差所允许的限度(事先指定的),s为估计的
标准差,可通过前人资料或小规模的调查得到。当α确定后,式中tα可查
t界值表(取双侧)。通常,若样本较大,α取0.05,tα=1.96,近似为2,则
n=(4s2)/d2 (15-2)
例2 现拟调查小学生血红蛋白含量,估计标准差为3g/dl,希望d不超过0.5g/dl,α=0.05,问需调查多少人?
本例s=3,d=0.5, α=0.05,按公式15-2计算:
n=(4×9)/0.25=144(人)
2.率的抽样 对于
计数资料,欲估计总体率时,可用公式估计样本例数。
n=[tα2P(1-P)]/d2 (15-3)
式中P为估计率,其余符号的意义同前。
n= (tα2/r2)[(1-P)/P] (15-4)
通常设: α=0.05,r=0.1,用公式16-4变换为:
n=(4/0.12)[(1-P)/P]=400×[(1-P)/P] (15-5)
例3 现拟调查
血吸虫感染率,据过去资料估计
流行率P=30%,设α=0.05,d=0.1P,问需调查多少人?
本例,P=0.30,α=0.05,r=0.1,按公式15-5计算:
n=400×[(1-0.3)/0.3]=933(人)
即需要调查933人。
资料分析
横断面研究所得资料,可按下列步骤进行整理分析。
1.检查与核对
原始资料,检查原始资料的
准确性与完整性,填补缺漏,删去重复,纠正错误。
2.对疾病或某种
健康状态按已明确规定好的标准,将全部
调查对象分组归类。
3.将原始资料分组进行比较,了解疾病或某健康状态在不同地区、不同时间以及不同人群组中的分布。
常见偏倚
当某一研究(观察)结果,与它的真值之间,出现了某种差值,这种差异的现象或结果,即称为偏倚(bias)。
1.
无应答偏倚(nonresponse bias) 对访问调查或
通信调查获得应答的比例称应答率。影响
应答率的因素有:(1)群众对调查了解的程度;(2)
调查方式或调查内容是否适当;(3)调查对象身体健康,故不关心疾病调查;(4)调查对象身体不好,或高龄拒绝调查;(5)调查对象外出未遇等。如果
无应答者比例较高,例如在抽样调查中达30%,即可造成偏倚。
2.
回忆偏倚或
报告偏倚这是由调查对象所引起的偏倚。例如某病患者常能较好地回忆既往的暴露史,而健康人则常遗忘以往的暴露。当调查某些
敏感性问题时,调查对象可能不愿做正确答复而造成报告偏倚。
3.调查人员偏倚例如调查员有意识地对具有某些特征的对象深入调查,对另一些则否。有时为了获得自已所需要的内容或答案,进行诱导性询问等。
4.
测量偏倚由于仪器不准、试剂不统一、实验条件不同等造成
测量结果不正确,可使调查结果偏离真值。
质量控制
质量控制即偏倚的控制,这是现况调查成败的关键。上述偏倚应在
设计阶段预先考虑防止发生。主要的控制方法如下。
1.坚持随机化原则,严格按照抽样
设计方案进行研究对象的选取。及时分析无应答的原因,补漏调查,提高
受检率。
2.选用精良的仪器设备并事先做好校准,保证测试结果的准确与可靠。
3.严格培训调查员,并对其进行监督和质量控制,统一调查程序和方法