본문 바로가기
AI/데이터 분석

인과성, 연관성, 상관계수

by 하이방가루 2022. 4. 18.
728x90
반응형

인과성

  어떤 상태(원인)에서 다른 상태(결과)가 필연적으로 일어나는 경우의 법칙성

  회귀분석모델을 통해 결과를 예측할 수 있다.

ex) 수학을 공부한 시간과 수학점수

 

연관성

  사물이나 현상이 일정한 관계를 맺는 특성이나 성질.(제 3의 힘이 존재함)

ex) 영어점수와 국어점수

 

상관계수

  두 변수간의 관계의 강도

$$ Corr(x,y) = \frac{\sum(x_i - \bar{x})(y_i - \bar{y})}{\sqrt{Var(x)} \cdot \sqrt{Var(y)}} $$

$ -1 < Corr < 1 $의 범위를 갖는다.

분모가 없으면 무한히 늘어날 수 있다.

 

평균을 기준으로

같은 방향으로 빈번하게 움직일수록 양의 상관관계가 커지고,

(x가 평균에서 -방향에 있을 때, y도 평균에서 -방향에 있고, x가 평균에서 +방향에 있을 때, y도 평균에서 +방향에 있음.)

양의 상관관계일 때

서로 다른 방향으로 빈번하게 움직일수록 음의 상관관계가 커진다.

(x가 평균에서 -방향에 있을 때, y는 평균에서 +방향에 있고, x가 평균에서 +방향에 있을 때, y는 평균에서 -방향에 있음.)

 

상관계수가 0에 가까울수록 무상관이고,

상관계수가 1에 가까울수록 양의 상관관계이고,

상관계수가 -1에 가까울수록 음의 상관관계(역상관관계)이다.

728x90
반응형

'AI > 데이터 분석' 카테고리의 다른 글

데이터 표준화, 정규화  (0) 2022.04.13

댓글