전산수학 상관(Correlations)

두개의 변량에서 , 한쪽의 변화와 다른쪽의 변화 사이에 어떤 경향이 있을때 , 두 변량 사이에 상관 관계가 있다고 하며, 두변수간의 상관 정도를 나타내는 것을 상관 계수라 한다.

전산수학 상관(Correlations)에 대해 알아 보도록 하겠습니다.

7-1. 상관계수(R)를 구하는 공식

7-1-1. 공분산

【참고】두변수 x, y가 독립변수일 때 두변수는 무상관 관계이므로 공분산은 0이 된다.

【예】두변수 X. Y의 공분산 SXY=5 이고 분산이 각각 SX2 =5, SY2 =5 일 때 상관 계수는

7-2. 상관계수(r)의 성질

두 변수 X와 Y사이에 상관 관계가 존재할 경우 그 관계의 강도를 측정하는 척도로 상관도에서 직선에 가까울수록 상관관계가 강하다. 즉 상관계수는±1에 가까울수록 강한 상관관계를 이룬다.

상관계수의 범위
-1≦ r ≦ 1 완전상관 (r ≧ 1), 무상관 (r = 0)

7-2-1. 양 상관

다음 그림과 같이 제 1상한에서 제 3상한으로 많이 분포되어  있을 경우는 두 변수 X와 Y는 양의 상관 이라 한다. (키와 몸무게, 수학점수와 지능지수, 수요와 공급등이 해당)

7-2-2. 음상관

아래의 그림과 같이 제 2상한 에서 제 4상한으로 많이 분포되어 있을 경우 두 변수 X와 Y는 음의 상관 관계가 있다. (가정수지와 엥겔지수, 생산량과 가격등이 해당)

7-2-3. 무상관

산포도(산점도)의 모양이 2차 곡선을 이루는 상태로 아래의 그림과 같이 N개의 산포점들이 각 상한에 균등 하게 분포되어 있을 경우 두 변수X와 Y를 무상관 이라고 한다.

7-2-4. 완전상관

다음 그림과 같이 모든 점이 일직선상에 있으면 완전상관이라 한다.

【예】 X, Y의 다음 통계표에서 좌측의 표에서 X가 증가할 때 Y도 함께 증가하므로 상관계수는 1이되고 우측의 표에서는 X가 증가할 때 Y가 감소하므로 상관계수는 -1이 된다.

7-3. 회귀

상관 관계를 수학적인 모형으로 어떤 예측이나 추론 등을 가능케하는 것.

7-3-1. 회귀의 종류

(1) 단순회귀(simple regression)

한개의 변수를 사용한 분석으로 선형회귀, 비선형회귀등이 있다.

(2) 다중회귀(multiple regression)

두개이상의 변수를 사용한 분석

7-3-2. 회귀계수와 상관계수

(1) x에 관한 y의 회귀직선

(2) y에 관한 x의 회귀직선

3) 회귀계수와 상관계수

① 회귀계수 b>0이면 r>0관계를 가지므로 양 상관

② 회귀계수 b<0이면 r<0관계를 가지므로 음 상관

③ 회귀계수 b=0이면 r=0 관계를 가지므로 무 상관

【참고】결정 계수(Coefficient Of Determinant)

결정 계수는 상관 계수를 제곱한 값으로

에 의해 아래와 같이 두변수 X의 Y에 대한 회귀 직선과 Y의 X에 대한 회귀 직선은 항상 같지 않음을 알 수 있다.

r : x, y의 상관계수byx : x에 대한 y의 회귀계수bxy : y에 대한 x의 회귀계수

은 x에 대한 y의 회기 계수와 y에 대한 x의 회귀계수의 곱과 같다.

이때 byx, bxy이 일치하면 완전상관(r= ±1), 두 회귀직선이 직교하면 무상관(r=0)의 관계를 갖는다.

【참고】가우스의 최소자승법

회귀 직선은 가우스의 최소자승법에 근거로 하며, 최소자승법은 확률 오차를 극소화 할 수 있는 방정식을 구하는 방법이다.


이상 “전산수학 상관(Correlations)”에 대해 알아 보았습니다.

댓글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다