SQL/개념
VARIANCE 함수
데이터분석가 이채은
2024. 11. 5. 17:20
VARIANCE 함수란?
"VARIANCE" 함수는 데이터 집합의 분산(Variance)을 계산하는 데 사용됩니다. 분산은 데이터가 평균을 중심으로 얼마나 퍼져 있는지를 나타내는 통계적 척도입니다.
분산의 정의
VARIANCE 함수의 구문
SELECT VARIANCE(column_name)
FROM table_name;
- column_name: 분산을 계산할 열의 이름.
- table_name: 데이터를 포함한 테이블 이름.
분산 계산의 두 가지의 유형
- 모분산 (Population Variance):
- 전체 데이터 집합을 기준으로 분산을 계산.
- SQL에서 기본적으로 제공되는 VARIANCE 함수는 모분산을 계산합니다.
- 표본분산 (Sample Variance):
- 데이터 집합의 일부를 기반으로 분산을 계산.
- SQL에서 VAR_SAMP를 사용하면 표본분산을 계산할 수 있습니다.
예시
문제: 모든 학생의 점수 분산을 계산하려면?
SELECT VARIANCE(score) AS score_variance
FROM Scores;