데이터 분석 기술 블로그

5. 기술 통계와 추론 통계 : 추론 통계 본문

데이터 분석

5. 기술 통계와 추론 통계 : 추론 통계

데이터분석가 이채은 2024. 8. 2. 09:00

추론 통계는 표본 집단으로부터 모집단의 특성을 추론한 것이 목적입니다. 다시 말해, 한 반의 통계치를 통해 학교 전체 학생의 통계치를 추정하는 것입니다.

추론(통계) = inferential = 추리의, 추정의 의한

 

예를 들어, A반의 평균 몸무게가 70kg라고 했을 때, '학교 전체 학생의 평균 몸무게가 65~75kg 구간 내에 존재할 확률이 어느 정도다'라는 식으로 추론하는 것입니다. 그렇다고 A반에 있는 모든 학생의 몸무게가 정확히 70kg인 것은 아니기 때문에 추론 통계는 표본으로 구한 70kg이라는 통계값을 통해 모집단의 몸무게를 나타내는 모수(parameter) 값이 얼마인지, 모수 값이 특정 구간 내에 존재할 확률이 얼마인지를 추정합니다.

 

선거 시즌에 자주 듣는 "이번 투표는 OOO 후보의 지지율이 OO%로 신뢰구간 OO%입니다."와 같이 신뢰 구간을 구하는 것과, 머신러닝 모델을 만들고 예측이나 분류하는 것 등이 추론 통계에 해당합니다.

 

추론 통계는 데이터의 편향과 분산, 확률 분포, 가설 검정과 유의도(p-value) 등 많은 개념을 알고 있어야 이해할 수 있습니다.

 

기술 통계와 추론 통계의 통합적인 프로세스

1. 표본을 특성을 분석 

2. 특성의 일반화 여부 판단

3. 모집단의 특성으로 추정