相关表和
相关图
可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间
相关
的程度。相关系数是用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自
平均值
的
离差
为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的
单相关系数
。
需要说明的是,皮尔逊相关系数并不是唯一的相关系数,但是最常见的相关系数,以下解释都是针对皮尔逊相关系数。
- 中文名
- 相关系数
- 外文名
- Correlation coefficient
- 基本释义
- 度量两个变量间的线性关系
- 常 用
- 皮尔逊相关系数
- 描 述
- 线性关系
- 特 点
- 无量纲
定义
简单相关系数
:又叫相关系数或线性相关系数,一般用字母r表示,用来度量两个变量间的线性关系。
定义式
[1]
性质
不相关和独立
生活示例
年广告费投入
|
12.5
|
15.3
|
23.2
|
26.4
|
33.5
|
34.4
|
39.4
|
45.2
|
55.4
|
60.9
|
---|---|---|---|---|---|---|---|---|---|---|
月均销售额
|
21.2
|
23.9
|
32.9
|
34.1
|
42.5
|
43.2
|
49.0
|
52.8
|
59.4
|
63.5
|
参照表1,可计算相关系数如表2:
序号
|
广告投入(万元)
x
|
月均销售额(万元)
y
|
|
|
|
---|---|---|---|---|---|
1
2
3
4
5
6
7
8
9
10
|
12.5
15.3
23.2
26.4
33.5
34.4
39.4
45.2
55.4
60.9
|
21.2
23.9
32.9
34.1
42.5
43.2
49.0
52.8
59.4
63.5
|
156.25
234.09
538.24
696.96
1122.25
1183.36
1552.36
2043.04
3069.16
3708.81
|
449.44
571.21
1082.41
1162.81
1806.25
1866.24
2401.00
2787.84
3528.36
4032.25
|
265.00
365.67
763.28
900.24
1423.75
1486.08
1930.60
2386.56
3290.76
3867.15
|
合计
|
346.2
|
422.5
|
14304.52
|
19687.81
|
16679.09
|
相关系数为0.9942,说明广告投入费与月平均销售额之间有高度的线性正相关关系。
应用
通过计算,很容易得出这3个分配方案中,B的相关系数是最大的,这样就评估到B的分配方案比实际分配方案A更好,在下一次的新产品上市分配计划中,就可以考虑用B这种分配方法来计算实际分配方案。
由相关系数计算公式可计算出6个性状间的相关系数,分析及检验结果见表3。由表3可以看出,冬季分蘖与每穗粒数之间呈现负相关(ρ = − 0.8982),即麦冬季分蘖越多,那么每穗的小麦粒数越少,其他性状之间的关系不显著。
缺点
需要指出的是,相关系数有一个明显的缺点,即它接近于1的程度与数据组数n相关,这容易给人一种假象。因为,当n较小时,相关系数的波动较大,对有些样本相关系数的绝对值易接近于1;当n较大时,相关系数的绝对值容易偏小。特别是当n=2时,相关系数的绝对值总为1。因此在
样本容量
n较小时,我们仅凭相关系数较大就判定变量x与y之间有密切的线性关系是不妥当的。