首页 理论教育 病例对照研究要求对照组与病例组保持相同特征,对象选择至关重要

病例对照研究要求对照组与病例组保持相同特征,对象选择至关重要

时间:2023-08-05 理论教育 版权反馈
【摘要】:2.配比病例对照研究要求对照组某些因素或特征与病例组保持相同。2.确定研究对象病例与对照的选择,尤其对照的选择为整个研究的关键之一。并且,随着匹配因素的增加,病例组和对照组之间在所研究的暴露因素上也逐渐趋同,从而掩盖或低估了暴露与疾病的联系,这种情况称匹配过度。样本含量的估计方法:并非样本量越大越好,样本量过大,常会影响调查工作的质量,增加负担和费用;病例组和对照组样本含量相等时研究效率最高。

病例对照研究要求对照组与病例组保持相同特征,对象选择至关重要

(一)概念

1.病例对照研究 主要用于探索病因的一种流行病学方法,是最常用的分析流行病学方法。它是以某人群内一组患有某种疾病的人(称为病例)和同一人群内未患这种疾病但在与患病有关的某些已知因素方面和病例组相似的人(称为对照)作为研究对象,调查他们过去对某个或某些可疑病因(即研究因子)的暴露有无和(或)暴露程度(剂量),通过对两组暴露史的比较,推断研究因子作为病因的可能性,如果病例组有暴露史者或严重暴露者的比例在统计学上显著高于对照组,则可认为这种暴露因素与疾病之间存在着统计学上的关联。病例对照研究模式见图11-2。从模式图可看出,病例对照研究从时间上讲,是从现在是否患有某种疾病出发,回顾过去可能的原因(暴露),在时间顺序上是逆向的,即由“果”推“因”,所以也称回顾性研究。例如,应用病例对照研究方法研究吸烟和肺癌之间的联系,可以选择一组肺癌病人作病例,再选择一组健康人或患有其他疾病的人作对照,分别调查他们过去吸烟情况,如果肺癌病人过去吸烟的比例明显高于对照者,则提示吸烟与肺癌的发生有关。

图11-2 病例对照研究原理示意图

2.暴露 是流行病学的一个术语,指研究对象曾经接触过某些因素或具备某种特征,或处于某种状态。这些因素、特征或状态即为暴露因素。例如接触过某种化学物质或物理因素,进食过的某种食品、饮料或药物等,人的性别、年龄或职业,某些生化指标、遗传指标等等均可成为暴露因素。暴露因素可以是有益的,也可以是有害的。通常把导致疾病事件增加的暴露因素称为危险因素或致病因素;把导致疾病事件降低的暴露因素称为保护因素。

(二)病例对照研究的类型

病例对照研究按不同的特征可以分成不同的类型,如果按是否采用配比对照组可以分成两类:

1.成组病例对照研究 又称非配比病例对照研究,从规定的病例和对照人群中随机抽取一定数量的样本组成病例组和对照组,除要求对照符合对照条件及对照组人数应等于或多于病例组人数外,没有其他规定及限制。

2.配比病例对照研究 要求对照组某些因素或特征与病例组保持相同。按配比情况分为两种:①成组配比病例对照研究,又称频数配比病例对照研究。要求对照组中配比的因素所占比例与病例组一致,例如病例组中男女性各半,60岁以上者占1/3,则选择对照组时也需要这样的比例;②个体配比病例对照研究,是以病例和对照个体为单位进行配比选择对照的方法。配比对照的个数为1时称为1∶1配比或配对,对照数多于1个的称为1∶2、1∶3、…、1∶R。实际应用中配比一般不超过1∶4,超过1∶4时统计效率难以提高,且增加调查难度。

(三)病例对照研究的实施

1.明确研究目的 在制定研究计划之前首先应该明确研究的目的。明确本研究是以探讨病因为目的还是以检验病因假设为目的。

2.确定研究对象 病例与对照的选择,尤其对照的选择为整个研究的关键之一。病例与对照选择的基本原则有两个:一为代表性,选择的病例应足以代表总体人群中该病的病人,对照也应足以代表产生病例的人群的暴露水平;二为可比性,病例组与对照组在年龄、性别等主要特征方面无明显差异。

(1)病例的选择:选择病例时首先要求有一个明确、统一的诊断标准,其次被选择的病例必须具有暴露于调查因素(可疑病因)的可能性,如研究口服避孕药与某些疾病的关系时,做过绝育术或因其他原因不用避孕药的患者不应作为研究对象,否则也将产生偏倚。此外,应尽量选择确诊的新病例,因为其回忆偏倚小,代表性好,容易合作。

(2)病例的来源:一是被研究的总体人群中的全部病例或者总体中随机样本人群中的全部病例,这种方法所选择的样本代表性较好,但实施时难度较大。二是医院住院或门诊病例,应尽量选择总体人群中不同地区、不同水平、不同种类的医院。虽然这种来源的病例样本代表性不如以人群为基础的病例对照研究,但实施较为方便。

(3)对照的选择和来源:选择对照的基本原则是从病例所来自人群中的非病例中随机选择。如果病例是从人群中选择的,可以选择同一人群中非病例的随机样本作为对照。如果病例是从医院中选择的,则可以从同一医院同一时间就诊或住院的其他病例中选择对照,也可以选择医院所在地人群中的健康人作为对照,或选择病例的配偶、同胞、亲戚、邻居、同学或同事等作为对照。

(4)对照的类型:对照的类型主要有两种,即匹配与不匹配。匹配是指在选择研究对象时,使病例组与对照组在某些特征或变量上保持一致,从而使病例与对照具有可比性,以提高研究的效率。

按匹配的方法可分为群体匹配和个体匹配两类。①群体匹配:也称成组匹配,在选择对照组时,使所要求匹配的因素在比例上与病例组中的一致。如病例组中男女各半,60岁以上者占1/3,则对照人群也如此选择。②个体匹配:从对象人群中选择一个或以上的对照配给每一个病例,使对照在规定的特征上与病例相同。一个病例配一个对照叫做1∶1配对,配两个以上的对照叫做1∶M配比。总的来说,匹配的因素多,可比性强,要控制的混杂因素也多。匹配因素过多会增加工作的难度,一部分病例可能因难以找到合适的对照而被放弃,从而影响了病例样本的代表性。并且,随着匹配因素的增加,病例组和对照组之间在所研究的暴露因素上也逐渐趋同,从而掩盖或低估了暴露与疾病的联系,这种情况称匹配过度。

3.样本量的估计

(1)影响样本大小的因素:①人群中被研究因素的暴露率,病例组暴露率(P1),对照组暴露率(P0);②相对危险度(RR)的估计值,在病例对照研究中一般不能直接计算出RR值,只能求其近似值OR;③第一类错误(假阳性错误)的概率(α);④第二类错误(假阴性错误)的概率(β),1-β称为把握度。

(2)样本含量的估计方法:并非样本量越大越好,样本量过大,常会影响调查工作的质量,增加负担和费用;病例组和对照组样本含量相等时研究效率最高。不同匹配方式的样本量计算方法不同,除了利用公式计算外,还可通过查表获得。

非匹配设计且病例数与对照数相等时,可用公式11-3或公式11-4计算样本量,其他设计类型的样本量计算方法请参阅相关教材。

或用近似公式:

式中,N为样本含量,P0为对照组暴露率,P1为病例组暴露率,=(P1+P0)/2,zα、zβ分别为α与β对应的正态分布分位数。已知OR值,P1可用以下公式计算:

例11-2 为研究某地肺癌与吸烟的关系,欲进行一次病例对照研究。已知某地普通人群中吸烟率P0为30%,OR为5.0,α定为0.05,把握度为0.90,问需要多少病例与对照?

本例,P0=30%,OR=5.0,α=0.05,把握度1-β=0.90。

先求P1

查表,zα=1.64,zβ=1.28。

代入公式11-3得:

病例组与对照组各需28人。

4.资料的来源与收集

(1)收集内容:主要收集一般情况、疾病情况和暴露史三个方面的资料。①一般情况:包括姓名、性别、年龄、民族、职业、文化程度经济收入和住址等;②疾病情况:包括发病时间、诊断依据、诊断医院等。必须有统一的、明确的诊断标准,对照也应采用相同的标准加以排除;③暴露史:包括是否暴露、暴露时间和剂量等。

(2)收集方法:主要有查阅现有记录资料、访问、体检和实验室检查等方法,其中以访问最为常用,一般是由经过培训的调查员按照统一的调查表进行。

(四)病例对照研究资料的分析

病例对照研究的目的就是通过对病例组和对照组之间各种可疑因素的暴露情况进行比较,从而判断哪些暴露因素与所研究疾病有联系,及其联系强度的大小。(www.xing528.com)

资料的分析包括四个基本步骤:①绘制四格表;②比较病例组与对照组暴露率的统计学差异;③计算与疾病发生相关因素的比值比OR;④进一步计算OR的可信区间,并对OR作出解释。

1.成组病例对照研究资料分析

(1)数据整理:如果暴露不分级,通常将研究数据归纳成四格表;如果暴露分级,则归纳为行×列表。

例11-3 某地一年半的时间内共诊断男性膀胱癌病人547例,从中随机抽出375例作为病例组,并从同年龄组的健康男性中随机抽取368人作为对照组,调查他们过去是否从事制鞋、制革、染料化工等可能接触致膀胱癌危险因素的职业,结果见表11-1。

表11-1 膀胱癌与职业暴露的关系

(2)统计描述:对研究对象的一般特征,如病例和对照的性别、年龄、职业、出生地、居住地、疾病类型等进行描述,一般情况下只能计算各种特征的构成比。此外,还需比较病例组和对照组之间除研究因素以外的各种特征是否均衡。

(3)统计推断:判断暴露与疾病是否有统计学联系,一般采用χ2检验(详见第八章第二节)。本例:

P<0.01,说明可疑职业暴露与膀胱癌有联系。

(4)联系强度大小及方向:经统计推断,若病例组和对照组之间在暴露因素上的差别有统计学意义,需进一步估计联系强度的大小及方向,常用的指标是比值比(OR)。

OR是指暴露者疾病的危险性是非暴露者的多少倍。当OR=1时,表示暴露与疾病无关联;当OR>1时,说明暴露使疾病的危险度增加,称为“正”关联,是疾病的危险因素;当OR<1时,说明暴露使疾病的危险度减少,称为“负”关联,即暴露对疾病有保护作用。

OR可信区间估计:一般估计总体OR值95%可信区间,常采用Miettinen法计算(公式11-7)。如果可信区间包含1,则暴露与疾病无关联,其意义与统计推断差异无统计学意义相同。

本例:

OR=1.99>1,表示暴露是疾病的危险因素。OR值95%可信区间为:1.41~2.81,不包含1,说明可疑职业暴露与膀胱癌有联系,该地男性中有制革、化工等可疑职业史者发生膀胱癌的危险是非暴露者的1.99倍。

2.配对(1∶1匹配)病例对照研究资料分析

(1)数据整理:一般将配对病例对照研究资料归纳成配对四格表的形式(表11-2)。

例11-4 临床医生收集50例海豹肢畸形儿同时采用1∶1配对的方式,每收集1名海豹肢畸形儿同时收集1名同期出生的性别相同的非海豹肢畸形儿作为对照,调查孕妇服用反应停的情况,结果见表11-2。

表11-2 海豹肢畸形儿病例对照研究资料

(2)统计推断:采用配对四格表资料χ2检验(详见第八章第二节)。本例:

(3)联系强度的大小及方向:配对设计资料比值比的计算用公式11-8。

本例:OR==32

OR95%CI==8.72~117.38

计算结果说明孕妇服用反应停与海豹肢畸形儿的出生有联系,服用反应停的孕妇生产海豹肢畸形儿危险是未服用的32倍。

(五)常见偏倚及其控制

1.选择偏倚 是由于选择研究对象的方法有问题或缺点,导致入选者与未入选者的某些特征有系统差别而产生的误差。由于病例对照研究中常常未能随机抽样,故易产生选择偏倚。特别是在医院选择病例与对照时更易产生偏倚。医院收治病人有不同的选择,同时,病人到哪个医院也有选择,不同病种也有不同的入院条件,这使研究的病例或对照不能代表有关人群。

选择偏倚的控制主要是在研究设计阶段,如以人群为基础选择研究对象或从多家医院选择研究对象、随机抽样、尽量选择新发病例等可减少选择偏倚。

2.信息偏倚 是由于调查方法、仪器、人员等方面存在问题致使所收集到的信息资料与真实情况不符,常见的如回忆偏倚、调查员偏倚等。规范研究方法、校正仪器、严格按照规定程序收集资料、完善质量控制方法、采用“盲法”收集资料等措施有利于减少此类偏倚。

3.混杂偏倚 是由于混杂因子所造成的偏倚。混杂因子是指既和研究的疾病有联系又和研究的暴露有联系的因子。年龄、性别和许多疾病与许多暴露都有联系,所以是最常见的混杂因子。控制的方法有三:①用匹配法进行研究,将混杂因素作为匹配因素;②分析时用分层分析法,按混杂因素进行分层;③进行多因素分析。

(六)病例对照研究的优缺点

病例对照研究的优点是:所需样本量小,病例易获取,因此工作量相对小,所需人力、物力较少,易于进行,出结果快;可以同时对一种疾病的多种病因进行研究;适合于对病因复杂、发病率低、潜伏期长的疾病进行研究。

病例对照研究的缺点是:样本代表性难以保证;暴露测量往往不够精确、可靠;不能直接计算发病率或死亡率。如果上述问题不能得到很好解决,可能会因存在偏倚导致错误结论。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈