본문 바로가기
생생수학

실용수학 - 실생활에 쓰이는 평균,분산, 표준편차에 대해서 알아봅시다.

by logicahead 2024. 9. 7.
반응형

 

수학

 

수학과 통계학에서 평균, 표준편차, 그리고 분산은 데이터를 이해하는 데 매우 중요한 개념입니다. 이 세 가지 개념은 우리가 여러 값들이 어떻게 분포되어 있는지를 이해하는 데 도움을 줍니다. 이를 쉽게 설명하기 위해 일상적인 예시를 사용해 보겠습니다.

 

1. 평균 (Mean)

평균은 우리가 흔히 말하는 평균값을 의미합니다. 어떤 데이터들의 중간 정도 값을 찾는 것이죠. 예를 들어, 시험 점수나 사람들의 키 같은 데이터를 볼 때, 그 값들의 가운데를 나타내는 것이 평균입니다.

예시:

친구 다섯 명의 시험 점수가 60, 70, 80, 90, 100점이라고 가정해 보겠습니다. 그들의 평균 점수는 어떻게 구할 수 있을까요?

평균을 구하는 방법은 매우 간단합니다. 모든 점수를 더한 후, 그 값을 점수의 개수로 나누면 됩니다:

 

$$\text{평균} = \frac{60 + 70 + 80 + 90 + 100}{5} = \frac{400}{5} = 80$$

 

즉, 친구들의 평균 점수는 80점입니다. 평균은 전체 데이터의 중심을 나타내주는 값이라고 볼 수 있습니다.

 

2. 분산 (Variance)

분산은 평균을 기준으로 데이터들이 얼마나 퍼져 있는지를 나타내는 값입니다. 예를 들어, 모든 점수가 평균(80점)에서 얼마나 떨어져 있는지를 나타내는 것이죠. 분산은 데이터가 얼마나 흩어져 있는지를 측정합니다.

분산 계산 방법:

분산을 계산하는 방법은, 각 데이터 값에서 평균을 뺀 값을 제곱한 후, 그 값들의 평균을 구하는 것입니다.

예시:

같은 친구들의 시험 점수에서, 평균(80점)과 각 점수 간의 차이를 계산한 후 제곱해 봅시다.

  1. 각 점수에서 평균을 뺀 값을 제곱:

$$(60 - 80)^2 = (-20)^2 = 400$$

$$(70 - 80)^2 = (-10)^2 = 100$$

$$(80 - 80)^2 = (0)^2 = 0$$

$$(90 - 80)^2 = (10)^2 = 100$$

$$(100 - 80)^2 = (20)^2 = 400$$

  1. 제곱한 값을 모두 더한 후, 데이터 개수로 나눕니다:

$$\text{분산} = \frac{400 + 100 + 0 + 100 + 400}{5} = \frac{1000}{5} = 200$$

 

즉, 이 데이터들의 분산은 200입니다. 분산은 각 데이터가 평균에서 얼마나 떨어져 있는지, 즉 얼마나 퍼져 있는지를 나타냅니다.

 

그런데 왜 제곱을 해줄가요? 제곱을 하지 않고 평균을 뺀 값을 모두 더하면 무조건 항상 0이 되버립니다. 제 말이 믿기지 않는다면 직접 계산해보세요. 이것을 편차 합의 성질이라고 부릅니다.

 

그러니까 각 데이터가 평균에서 얼마나 떨어져있는지 편차합의 평균으로는 나타낼 수 없어서, 편차제곱합의 평균으로 나타낸 것으로 볼 수 있습니다.

 

3. 표준편차 (Standard Deviation)

표준편차는 분산을 더 직관적으로 표현한 값입니다. 분산은 제곱된 값을 사용하는데, 이 값이 크면 크다는 건 알겠지만, 그 크기가 실제로 얼마나 큰지를 느끼기는 어렵습니다. 그래서 분산에서 제곱근을 취해, 다시 원래 데이터와 같은 단위를 가진 값으로 만든 것이 표준편차입니다.

표준편차 계산:

표준편차는 분산의 제곱근을 취해 구합니다. 위에서 구한 분산 값이 200이므로, 표준편차는 다음과 같습니다.

 

$$\text{표준편차} = \sqrt{200} \approx 14.14$$

 

즉, 친구들의 시험 점수에서 평균인 80점에서 대부분의 점수들이 약 14점 정도 떨어져 있다는 것을 의미합니다.

 

평균, 분산, 표준편차를 쉽게 이해하기 위해 친구들의 키로 다시 한번 예시를 들어 볼게요.

예시:

친구 5명의 키가 각각 160cm, 165cm, 170cm, 175cm, 180cm라고 합시다.

  1. 평균은 이들의 중간 키를 나타냅니다:

$$\text{평균} = \frac{160 + 165 + 170 + 175 + 180}{5} = \frac{850}{5} = 170 \text{cm}$$

  1. 분산은 이들의 키가 평균에서 얼마나 떨어져 있는지를 나타냅니다. 키가 고르게 퍼져 있을수록 분산이 큽니다. 만약 모두 170cm라면, 분산은 0이겠죠.
  2. 표준편차는 각 키들이 평균 170cm에서 얼마나 떨어져 있는지를 보여줍니다. 대부분의 친구들이 평균인 170cm에서 어느 정도 차이가 나는지를 쉽게 볼 수 있죠.

요약

  • 평균은 전체 데이터의 중심을 나타냅니다.
  • 분산은 데이터가 평균을 중심으로 얼마나 퍼져 있는지를 알려줍니다.
  • 표준편차는 분산의 제곱근으로, 데이터들이 평균에서 얼마나 벗어나 있는지를 쉽게 이해할 수 있도록 도와줍니다.

이 개념들은 데이터를 분석하고 해석하는 데 중요한 역할을 하며, 우리가 일상생활에서 많은 상황을 수학적으로 이해하는 데 도움을 줍니다.