2011安全工程师考试-《生产管理知识》精讲讲义124
三、职业卫生常用的统计分析方法职业危害资料的统计分析与其他资料一样,应按照资料类型和统计分析方法条件的要求进行。
(一)计量资料的统计分析
计量资料可采用集中趋势和离散趋势指标计算,t检验、u检验、方差分析、秩和检验、相关与回归,下面以常用的t检验和u检验为例进行介绍。 1.t检验和u检验
t检验和u检验就是统计量为t.u的假设检验,两者均是常见的计量资料假设检验方法。当样本含量n较大(如,z>30)时,样本均数符合正态分布,故可用U检验进行分析。当样本含量n小时,若观察值x符合正态分布,则用t检验(因此时样本均数符合t分布),当x为未知分布时应采用秩和检验。 (1)样本均数与总体均数比较的t检验。
样本均数与总体均数比较的t检验实际上是推断该样本来自的总体均数μ与已知的某一总体均数μ0(常为理论值或标准值)有无差别。如根据大量调查,已知健康成年男性的脉搏均数为72次/分,某医生在一山区随即抽查了25名健康男性,求得其脉搏均数为74.2次/分,标准差为6.0次/分,问是否能据此认为该山区成年男性的脉搏均数高于一般成年男性。
上述两个均数不等既可能是抽样误差所致,也有可能真是环境差异的影响,为此,可用t检验进行判断,检验过程如下:
1)建立假设
h0:μ=μo=72次/分,H1:μ>卢μ0,检验水准为单侧0.05。
2)计算统计量。进行样本均数与总体均数比较的t检验时t值为样本均数与总体均数差值的绝对值除以标准误的商,其中标准误为标准差除以样本含量算术平方根的商。
3)确定概率,作出判断。以自由度v(样本含量n减1)查t界值表,0.025<P<0.05,拒绝H0,接受H1,可认为该山区成年男性的脉搏均数高于一般成年男性。
应注意的是,当样本含量"较大时,可用"检验代替f检验。 (2)配对设计的,检验。
配对设计是一种比较特殊的设计方式,能够很好地控制非实验因素对结果的影响,有自身配对和非自身配对之分。配对设计资料的,检验实际上是用配对差值与总体均数"o"进行比较,即推断差数的总体均数是否为"o"。故其检验过程与样本均数与总体均数比较的f检验类似,即:
1)建立假设
Ho:ud=0,即差值的总体均数为"0",H1:μd>0或μd<0,即差值的总体均数不为"0",检验水准为0.05。
2)计算统计量。进行配对设计t检验时,值为差值均数与0之差的绝对值除以差值标准误的商,其中差值标准误为差值标准差除以样本含量算术平方根的商。
3)确定概率,作出判断。以自由度v(对子数减1)查f界值表,若P<O.05,则拒绝H0,接受H1,若P>=0.05,则还不能拒绝Ho。 (3)成组设计两样本均数比较的,检验。
成组设计两样本均数比较的t检验又称成组比较或完全随机设计的t检验,其目的是推断两个样本分别代表的总体均数是否相等。其检验过程与上述两种;检验也没有大的差别,只是假设的表达和t值的计算公式不同。
两样本均数比较的,检验,其假设一般为:Ho:μ1=μ2,即两样本来自的总体均数相等,H1:μ1>μ2或μ1<μ2,即两样本来自的总体均数不相等,检验水准为0.05。
计算t统计量时是用两样本均数差值的绝对值除以两样本均数差值的标准误。
应注意的是当样本含量n较大时(如大于100时)可用"检验代替,检验,此时"值的汁算公式较,值的计算公式要简单的多, (4)t检验的应用条件和注意事项,两个小样本均数比较的,检验有以下应用条件:
1)两样本来白的总体均符合正态分布。
2)两样本来白的总体方差齐。
故在进行两小样本均数比较的f检验之前,要用方差齐性检验来推断两样本代表的总体方差是否相等,方差齐性检验的方法使用F检验,其原理是看较大样本方差与较小样本方差的商是否接近"1"。若接近"1",则可认为两样本代表的总体方差齐。判断两样本来白的总体是否符合正态分布,可用正态性检验的方法。
若两样本来白的总体方差不齐,也不符合正态分布,对符合对数正态分布的资料可用其几何均数进行,检验,对其他资料可用f,检验或秩和检验进行分析。 (二)计数资料的统计分析
计数资料可采用的分析方法有相对数计算、二项分布、x2检验,下面以x2检验为例进行介绍,
1.x2检验
卡方检验是用途很广的一种假设检验方法,这里主要介绍它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验
以及分类资料的相关分析等。 (1)卡方检验基本思想。在分类资料统计分析中常会遇到这样的资料,如两组大白鼠在不同致癌剂作用下的发癌率如表10-3问两组发癌率有无差别?
表10--3 两组大白鼠在不同致癌作用下的发痛率
处理组
发癌数
未发癌数
合计
发癌率%
甲组
52
19
71
73.24
乙组
39
3
42
92.86
合计
91
22
113
80.33
52,19;39,3是表10--3中最基本的数据,因此表10--3资料又被称之为四格表资料。卡方检验的统计量是卡方值,它是每个格子实际频数A与理论频数了差值平方与理论频数之比的累计和。每个格子中的理论频数了是在假定两组的发癌率相等(均等于两组合计的发癌率)的情况下计算出来的,如第一行第一列的理论频数为71x91/113=57.18,故
卡方值越大,说明实际频数与理论频数的差别越明显,两组发癌率不同的可能性越大。 (2)四格表资料的卡方检验。四格表资料的卡方检验用于进行两个率或两个构成比的比较。
1)专用公式。若四格表资料四个格子的频数分别为o,b,c,d,则四格表资料卡方检验的卡方值=(ad-bc)2xn/(a+b)(c+d)(a+c)(b+d),自由度v=(行数-1)(列数-1)。
2)应用条件。要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但理论频数有小于5的情况时卡方值需要校正,当样本含量小于40时只能用确切概率法计算概率, (3)行x列表资料的卡方检验
行x列表资料的卡方检验用于多个率或多个构成比的比较。
1)专用公式。r行c列表资料卡方检验的卡方阵n((A11/nlnl+A12/nih2+...+Arc/nrnc)-l
2)应用条件。要求每个格子中的理论频数了均大于5或1<T<5的格子数不超过总格子数的1/5。当有了<1或1<T<5的格子较多时,可采用并行并列、删行删列、增大样本含量的办法使其符合行x列表资料卡方检验的应用条件。而多个率的两两比较可采用行x列表分割的办法。 (4)列联表资料的卡方检验。同一组对象,观察每一个个体对两种分类方法的表现,
结果构成双向交叉排列的统计表就是列联表。
①只xC列联表的卡方检验。只xC列联表的卡方检验用于RxC列联表的相关分析卡方值的计算和检验过程与行x列表资料的卡方检验相同。
②2X2列联表的卡方检验:
2x2列联表的卡方检验又称配对记数资料或配对四格表资料的卡方检验,根据卡方值计算公式的不同,可以达到不同的目的。当用一般四格表的卡方检验计算时,卡方值:(ad-bc)2n/(a+b)(c+d)(a+c)(b+d),此时用于进行配对四格表的相关分析,如考察两种检验方法的结果有无关系;当卡方值:(1b-cl-1)2/(b+c)时,此时卡方检验用来进行四格表的差异检验,如考察两种检验方法的检出率有无差别。
列联表卡方检验应用中的注意事项同及XC表的卡方检验相同。
小结:本讲讲述了"统计基础"和"职业卫生统计"的有关内容。要求重点学习:统计的原理和方法;常用统计图表的编制;职业危害统计指标等内容。
页:
[1]