데이터 분석 기술 블로그

What is a Random Variable? (확률 변수란?) 본문

데이터 사이언스/수리 통계학

What is a Random Variable? (확률 변수란?)

데이터분석가 이채은 2025. 3. 15. 14:14

확률 변수란?

확률 변수(Random Variable)는 어떤 확률적인 실험에서 가능한 결과를 숫자로 변환하는 변수다.
즉, 확률적으로 결정되는 값을 의미한다.

출처: https://jethrojeff.com/


확률 변수의 개념

확률 변수는 실험 결과를 수학적으로 표현하기 위해 사용된다.
예를 들어, 동전을 던지는 실험에서:

  • 앞면이 나오면 1,
  • 뒷면이 나오면 0

이렇게 숫자로 변환하면 확률 변수가 된다.


확률 변수의 두 가지 유형

(1) 이산 확률 변수 (Discrete Random Variable)

  • 정해진 개수의 값만 가질 수 있는 확률 변수.
  • 주어진 값 이외의 값은 존재하지 않음.
  • 예:
    • 동전 던지기: X = {0(뒷면), 1(앞면)}
    • 주사위 던지기: X = {1, 2, 3, 4, 5, 6}
    • 한 가게의 하루 방문 고객 수: X = {0, 1, 2,...}

(2) 연속 확률 변수 (Continuous Random Variable)

  • 특정 구간에서 무한한 값을 가질 수 있음.
  • 실수(real number) 값을 가질 수 있음.
  • 예:
    • 사람의 키: X = {170.1cm, 180.5cm, 165.3cm,...}
    • 특정 지역의 기온: X = {23.12°C, 24.56°C,...}
    • 달리기 기록(시간): X = {9.58초, 10.21초,...}

확률 변수의 수학적 표현

확률 변수는 보통 대문자 X로 표기하고, 특정 값 x를 가질 확률을 P(X = x)로 표현한다.

 

예제:

  • 동전 던지기에서 앞면이 나올 확률
    P(X = 1) = 0.5
  • 주사위에서 4가 나올 확률
    P(X = 4) = 1/6

확률 질량 함수 (PMF)

이산 확률 변수는 확률 질량 함수(Probability Mass Function, PMF)로 표현할 수 있다.
PMF는 확률 변수가 특정 값을 가질 확률을 나타내는 함수이다.

 

예:
주사위를 던졌을 때 각 숫자가 나올 확률은

즉, 이산 확률 변수의 확률은 개별 값에 대해 정의된다.