《医学统计学》第二、相关系数的计算及假设检验页
(一)相关系数计算法
计算相关系数的基本公式为:
(9.1)
式(9.1)中r为相关系数,∑(X-X)2为X的离均差平方和,∑(Y-Y)2为Y的离均差平方和,∑(X-X)(Y-Y)为X与Y的离均差乘积之和,简称离均差积之和,此值可正可负。以此式为基础计算相关系数的方法称积差法,在实际应用时式(9.1)中各离均差平方和(简称差方和)与积之和可化为
(9.2)
现举例说明计算相关系数的一般步骤:
例9.1 测定15名健康成人血液的一般凝血酶浓度(单位/毫升)及血液的凝固时间(秒),测定结果记录于表9.1第(2)、(3)栏,问血凝时间与凝血酶浓度间有无相关?
1.绘图,将表9.1第(2)、(3)栏各对数据绘成散点图,见图9.9。
2.求出∑X、∑Y、∑X2、∑Y2、∑XY,见表9.1下方。
3,代入公式,求出r值。
图9.9 凝血时间与凝血酶浓度散点图及回归直线
表9.1 相关系数计算表
受试者号(1)凝血酶浓度(单位/毫升)X(2)凝血时间(秒)Y(3)11.11421.21331.01540.91551.21361.11470.91680.91591.014100.916111.115120.916131.114141.015150.817合计15.1222
∑X=15.1 ∑Y=222
∑XY=221.7
∑X2=15.41∑Y2=3304
本例的相关系数r=-0.9070,负值表示血凝时间随凝血酶浓度的增高而缩短;绝对值∣-0.9070∣表示这一关系的密切程度。至于此相关系数是否显著,则要经过下面的分析。
(二)相关系数的假设检验
虽然样本相关系数r可作为总体相关系数ρ的估计值,但从相关系数ρ=0的总体中抽出的样本,计算其相关系数r,因为有抽样误差,故不一定是0,要判断不等于0的r值是来自ρ=0的总体还是来自ρ≠0的总体,必须进行显著性检验。检验假设是ρ=0,r与0的差别是否显著要按该样本来自ρ=0的总体概率而定。如果从相关系数ρ=0的总体中取得某r值的概率P>0.05,我们就接受假设,认为此r值的很可能是从此总体中取得的。因此判断两变量间无显著关系;如果取得r值的概率P≤0.05或P≤0.01,我们就在α=0.05或α=0.01水准上拒绝检验假设,认为该r值不是来自ρ=0的总体,而是来自ρ≠0的另一个总体,因此就判断两变量间有显著关系。
由于来自ρ-0的总体的所有样本相关系数呈对称分布,故r的显著性可用t检验来进行。本例r=-0.9070,进行t检验的步骤为:
1.建立检验假设,H:ρ=0,H1:ρ≠0,α=0.01
2.计算相关系数的r的t值:
(9.3)
3.查t值表作结论
ν=n-2=15-2=13
根据专业知识知道凝血酶浓度与凝血时间之间不会呈正相关,故宜用单侧界限,查t值表得
t0.01,13=2.650
今∣tr∣>t0.01,13,Pr0.01,13,P