데이터 분석 기술 블로그

Wrong Definition of Probability (잘못된 확률 정의) 본문

데이터 사이언스/수리 통계학

Wrong Definition of Probability (잘못된 확률 정의)

데이터분석가 이채은 2025. 3. 5. 12:56

잘못된 확률 정의 (일반적인 실수)

 

확률을 잘못 정의하는 대표적인 실수 중 하나는 직관에만 의존하는 것이다. 사람들이 흔히 하는 오류는 다음과 같다:

 

  1. "확률이 50%라고 하면 무조건 반반이다?"
    • 예: "동전을 던지면 앞면과 뒷면이 나올 확률이 50%이므로, 10번 던지면 반드시 5번 앞면이 나온다!"
    • 하지만 실제로는 단기 시행에서는 변동성이 크다. 10번 던졌을 때 3번만 나올 수도 있고, 7번 나올 수도 있다.
    • 확률은 장기적인 평균을 의미하는 것이지, 단기적으로 항상 같은 비율을 보장하는 것이 아니다.
  2. "모든 사건이 동일한 확률을 갖는다?"
    • 예: "주사위 던지기에서 1, 2, 3, 4, 5, 6이 나올 확률은 같아야 한다!"
    • 사실 공정한 주사위라면 맞지만, 편향된 주사위라면 특정 숫자가 더 자주 나올 수도 있다.
    • 확률을 정의할 때는 항상 실험 조건과 배경을 고려해야 한다.
  3. "확률은 단순히 경험에 의존한다?"
    • 예: "지난번에 주사위를 던졌을 때 6이 두 번 나왔으니까, 이번에는 6이 안 나올 확률이 높다!"
    • 하지만 확률은 독립적인 시행에서 과거의 결과에 영향을 받지 않는다.
    • 주사위를 던질 때마다 모든 숫자가 나올 확률은 여전히 1/6이다.

예제 1: 도박사의 오류 (Gambler’s Fallacy)

  • 상황: 어떤 사람이 카지노에서 룰렛을 돌리고 있다. 빨간색이 연속으로 10번 나왔다. 그는 다음번에는 검은색이 나올 확률이 더 높다고 생각한다.
  • 잘못된 생각: "빨간색이 너무 많이 나왔으니까, 이제 검은색이 나올 차례야!"
  • 올바른 이해: 룰렛은 독립 사건이다. 과거 결과와 상관없이 다음 회차에서 빨간색이 나올 확률과 검은색이 나올 확률은 동일하다.

예제 2: 버스 정류장 오류

  • 상황: 어떤 사람이 버스를 기다리고 있는데, 이미 30분 동안 버스가 안 왔다. 그는 "이제 곧 버스가 올 확률이 높아!"라고 생각한다.
  • 잘못된 생각: "이제까지 안 왔으니까, 곧 올 확률이 커!"
  • 올바른 이해: 버스의 도착 시간이 랜덤 한 경우라면, 버스가 30분 동안 오지 않았다고 해서 다음 1분 내에 올 확률이 증가하지 않는다.

예제 3: 스포츠 경기에서의 확률 오류

  • 상황: 어떤 농구 선수가 3점 슛을 연속으로 5번 성공했다. 해설자가 "이 선수는 이제 슛 감각이 올라왔으니까 다음 슛도 넣을 확률이 높다!"라고 말한다.
  • 잘못된 생각: "슛을 여러 번 성공했으니, 다음에도 성공 확률이 높다."
  • 올바른 이해: 선수의 슛 성공 확률은 그가 슛을 던지는 조건(피로도, 수비 압박 등)에 따라 다를 뿐, 단순히 과거 성공 횟수가 많다고 다음 성공 확률이 증가하는 건 아니다.

이처럼 확률을 직관적으로만 해석하면 오류에 빠질 수 있다.