相关系数

研究变量之间线性相关程度的量
收藏
0 有用+1
0
本词条由 《中国科技信息》杂志社 参与编辑并审核,经 科普中国·科学百科 认证 。
相关系数是最早由统计学家 卡尔·皮尔逊 设计的统计指标,是研究变量之间 线性相关 程度的量,一般用字母 r 表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是 皮尔逊相关系数
相关表和 相关图 可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间 相关 的程度。相关系数是用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自 平均值 离差 为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的 单相关系数
需要说明的是,皮尔逊相关系数并不是唯一的相关系数,但是最常见的相关系数,以下解释都是针对皮尔逊相关系数。
依据相关现象之间的不同特征,其统计指标的名称有所不同。如将反映两变量间线性相关关系的统计指标称为相关系数(相关系数的平方称为 判定系数 );将反映两变量间 曲线相关 关系的统计指标称为非线性相关系数、非线性判定系数;将反映多元线性相关关系的统计指标称为 复相关系数 复判定系数 等。
中文名
相关系数
外文名
Correlation coefficient
基本释义
度量两个变量间的线性关系
常    用
皮尔逊相关系数
描    述
线性关系
特    点
无量纲

定义

相关关系是一种非确定性的关系,相关系数是研究变量之间 线性相关 程度的量。由于研究对象的不同,相关系数有如下几种定义方式。
简单相关系数 :又叫相关系数或线性相关系数,一般用字母r表示,用来度量两个变量间的线性关系。
定义式 [1]
其中,Cov(X,Y)为X与Y的 协方差 ,Var[X]为X的 方差 ,Var[Y]为Y的 方差
复相关系数 :又叫多重相关系数。复相关是指 因变量 与多个自变量之间的相关关系。例如,某种商品的季节性 需求量 与其价格水平、职工收入水平等现象之间呈现复相关关系。
典型相关系数:是先对原来各组变量进行 主成分分析 ,得到新的线性关系的综合指标,再通过综合指标之间的线性相关系数来研究原各组变量间相关关系。

性质

不相关和独立

生活示例

表1 广告费与月平均销售额相关表 单位:万元
年广告费投入
12.5
15.3
23.2
26.4
33.5
34.4
39.4
45.2
55.4
60.9
月均销售额
21.2
23.9
32.9
34.1
42.5
43.2
49.0
52.8
59.4
63.5
参照表1,可计算相关系数如表2:
序号
广告投入(万元)
x
月均销售额(万元)
y
1
2
3
4
5
6
7
8
9
10
12.5
15.3
23.2
26.4
33.5
34.4
39.4
45.2
55.4
60.9
21.2
23.9
32.9
34.1
42.5
43.2
49.0
52.8
59.4
63.5
156.25
234.09
538.24
696.96
1122.25
1183.36
1552.36
2043.04
3069.16
3708.81
449.44
571.21
1082.41
1162.81
1806.25
1866.24
2401.00
2787.84
3528.36
4032.25
265.00
365.67
763.28
900.24
1423.75
1486.08
1930.60
2386.56
3290.76
3867.15
合计
346.2
422.5
14304.52
19687.81
16679.09
相关系数为0.9942,说明广告投入费与月平均销售额之间有高度的线性正相关关系。

应用

通过计算,很容易得出这3个分配方案中,B的相关系数是最大的,这样就评估到B的分配方案比实际分配方案A更好,在下一次的新产品上市分配计划中,就可以考虑用B这种分配方法来计算实际分配方案。

聚类分析

由相关系数计算公式可计算出6个性状间的相关系数,分析及检验结果见表3。由表3可以看出,冬季分蘖与每穗粒数之间呈现负相关(ρ = − 0.8982),即麦冬季分蘖越多,那么每穗的小麦粒数越少,其他性状之间的关系不显著。