본문 바로가기
금융

회귀분석 뜻, 종류, 가정, 예시, 상관분석과의 차이 (Feat.쉽게 정리)

by 지식지기 2024. 8. 24.

회귀분석에 대해 쉽게 알아볼까요?
데이터 회귀분석에 대해 쉽게 알아볼까요?

 

 

회귀분석은 가장 많이 쓰이는 데이터 분석 방법 중 하나입니다.

 

하지만 비전공자 분들은 이해하기 쉽지 않을 수 있는데요.

 

그래서 제가 이해하기 쉽게,

회귀분석 뜻, 종류, 가정, 예시, 상관분석과의 차이점에 대해 정리해보았습니다.

 

회귀분석 한방에 정리
 1. 회귀분석 뜻
 2. 회귀분석 종류
 3. 회귀분석 가정
 4. 회귀분석 예시
 5. 회귀분석과 상관분석의 차이점

 

 

1. 회귀분석이란?

 

회귀분석은 어떤 현상에서 "어떤 이유로 결과가 이렇게 나타났을까?"를 알아보는 방법입니다.

 

예를 들어, 시험 점수가 어떻게 높아질 수 있는지, 날씨가 어떻게 변하는지 등을 예측할 때 사용합니다.

 

회귀분석을 통해 우리는 "이 원인(원인A)이 있으면 결과(결과B)가 이렇게 된다"라고 말할 수 있습니다.

 

 

2. 회귀분석의 종류

 

2.1. 단순 회귀분석

하나의 원인이 하나의 결과에 영향을 미치는 경우입니다.

예를 들어, 공부 시간(원인)과 시험 점수(결과) 사이의 관계를 보는 것입니다.

 

2.2. 다중 회귀분석

여러 원인이 하나의 결과에 영향을 미치는 경우입니다.

예를 들어, 공부 시간, 수면 시간, 학원의 수업(여러 원인)과 시험 점수(결과) 사이의 관계를 분석합니다.

 

2.3. 로지스틱 회귀분석

결과가 '참' 또는 '거짓'처럼 둘 중 하나인 경우를 분석하는 방법입니다.

예를 들어, 이 학생이 다음 시험에서 합격할 확률을 분석할 때 사용합니다.

 

2.4. 다항 회귀분석

결과가 여러 개의 선택지 중 하나인 경우를 분석하는 방법입니다.

예를 들어, 사람의 키에 따라 옷 사이즈가 어떤 크기로 될지 예측할 때 사용할 수 있습니다.

 

 

3. 회귀분석의 가정

회귀분석을 할 때는 몇 가지 조건을 고려해야 해요. 이 조건들을 가정이라고 부릅니다.

 

  • 선형성 : 원인과 결과 사이의 관계가 직선으로 표현될 수 있어야 합니다.
  • 독립성 : 각 원인은 서로 영향을 미치지 않아야 합니다.
  • 등분산성 : 원인의 변화에 따라 결과의 변동성이 일정해야 합니다.
  • 정규성 : 결과가 특정한 패턴 없이 자연스럽게 분포되어 있어야 합니다.

 

 

4. 회귀분석 예시

  • 예시 1 : 학생의 공부 시간(원인)시험 점수(결과)에 어떤 영향을 미치는지 분석합니다.
  • 예시 2 : 부모님의 키(여러 원인)자녀의 키(결과)에 어떤 영향을 미치는지 분석합니다.
  • 예시 3 : 비 오는 날의 빈도(원인)우산 판매량(결과)에 어떤 영향을 미치는지 분석합니다.

 

 

5. 상관분석과 회귀분석의 차이

상관분석은 "두 가지가 서로 얼마나 관련이 있는가?"를 알아보는 방법이에요.

예를 들어, 키가 크면 몸무게가 무거운 경향이 있는지 알아보는 거죠.

상관분석은 '키'와 '몸무게'가 관련이 있다고만 알려줄 뿐, '키가 몸무게에 얼마나 영향을 주는지'는 말해주지 않아요.

 

회귀분석은 "이것 때문에 저것이 이렇게 된다"라는 관계를 명확하게 분석하는 방법입니다.

키가 몸무게에 얼마나 영향을 주는지, 정확히 얼마나 몸무게가 늘어나는지 예측할 수 있어요.

쉽게 말해서, 상관분석은 두 요소가 같이 움직이는지 보는 것이고, 회귀분석은 한 요소가 다른 요소를 얼마나 움직이게 하는지 보는 것이랍니다.

댓글