두개의 변량에서 , 한쪽의 변화와 다른쪽의 변화 사이에 어떤 경향이 있을때 , 두 변량 사이에 상관 관계가 있다고 하며, 두변수간의 상관 정도를 나타내는 것을 상관 계수라 한다.
전산수학 상관(Correlations)에 대해 알아 보도록 하겠습니다.
7-1. 상관계수(R)를 구하는 공식
7-1-1. 공분산
【참고】두변수 x, y가 독립변수일 때 두변수는 무상관 관계이므로 공분산은 0이 된다.
【예】두변수 X. Y의 공분산 SXY=5 이고 분산이 각각 SX2 =5, SY2 =5 일 때 상관 계수는
7-2. 상관계수(r)의 성질
두 변수 X와 Y사이에 상관 관계가 존재할 경우 그 관계의 강도를 측정하는 척도로 상관도에서 직선에 가까울수록 상관관계가 강하다. 즉 상관계수는±1에 가까울수록 강한 상관관계를 이룬다.
상관계수의 범위 -1≦ r ≦ 1 완전상관 (r ≧ 1), 무상관 (r = 0) |
7-2-1. 양 상관
다음 그림과 같이 제 1상한에서 제 3상한으로 많이 분포되어 있을 경우는 두 변수 X와 Y는 양의 상관 이라 한다. (키와 몸무게, 수학점수와 지능지수, 수요와 공급등이 해당)
7-2-2. 음상관
아래의 그림과 같이 제 2상한 에서 제 4상한으로 많이 분포되어 있을 경우 두 변수 X와 Y는 음의 상관 관계가 있다. (가정수지와 엥겔지수, 생산량과 가격등이 해당)
7-2-3. 무상관
산포도(산점도)의 모양이 2차 곡선을 이루는 상태로 아래의 그림과 같이 N개의 산포점들이 각 상한에 균등 하게 분포되어 있을 경우 두 변수X와 Y를 무상관 이라고 한다.
7-2-4. 완전상관
다음 그림과 같이 모든 점이 일직선상에 있으면 완전상관이라 한다.
【예】 X, Y의 다음 통계표에서 좌측의 표에서 X가 증가할 때 Y도 함께 증가하므로 상관계수는 1이되고 우측의 표에서는 X가 증가할 때 Y가 감소하므로 상관계수는 -1이 된다.
7-3. 회귀
상관 관계를 수학적인 모형으로 어떤 예측이나 추론 등을 가능케하는 것.
7-3-1. 회귀의 종류
(1) 단순회귀(simple regression)
한개의 변수를 사용한 분석으로 선형회귀, 비선형회귀등이 있다.
(2) 다중회귀(multiple regression)
두개이상의 변수를 사용한 분석
7-3-2. 회귀계수와 상관계수
(1) x에 관한 y의 회귀직선
(2) y에 관한 x의 회귀직선
3) 회귀계수와 상관계수
① 회귀계수 b>0이면 r>0관계를 가지므로 양 상관
② 회귀계수 b<0이면 r<0관계를 가지므로 음 상관
③ 회귀계수 b=0이면 r=0 관계를 가지므로 무 상관
【참고】결정 계수(Coefficient Of Determinant)
결정 계수는 상관 계수를 제곱한 값으로
에 의해 아래와 같이 두변수 X의 Y에 대한 회귀 직선과 Y의 X에 대한 회귀 직선은 항상 같지 않음을 알 수 있다.
r : x, y의 상관계수byx : x에 대한 y의 회귀계수bxy : y에 대한 x의 회귀계수 |
은 x에 대한 y의 회기 계수와 y에 대한 x의 회귀계수의 곱과 같다.
이때 byx, bxy이 일치하면 완전상관(r= ±1), 두 회귀직선이 직교하면 무상관(r=0)의 관계를 갖는다.
【참고】가우스의 최소자승법
회귀 직선은 가우스의 최소자승법에 근거로 하며, 최소자승법은 확률 오차를 극소화 할 수 있는 방정식을 구하는 방법이다.
이상 “전산수학 상관(Correlations)”에 대해 알아 보았습니다.
답글 남기기