본문 바로가기

DATA

마케터를 위한 통계 | 변량 , 도수 , 상대도수 , 도수분포표 , 히스토그램

반응형

변량

  • 데이터의 개별 값 

. 예를 들어, 한 반의 학생들의 시험 점수를 조사했다면, 각 학생의 점수가 바로 변량이다.

 

계급

  • 비슷한 변량을 범위별로 나눈 그룹
  • 데이터를 그룹화할 때 사용 

예를 들어, 0점에서 100점까지 분포된 학생들의 시험 점수를 10점 단위로 나누어 계급을 만들 수 있다.

이렇게 계급을 활용하면 전체 학생들의 성적 분포를 쉽게 이해할 수 있다. 

 

도수

  • 특정 데이터 값이나 계급이 나타나는 횟수

위 데이터에서는 각 계급에 속하는 학생 수가 그 계급의 도수이다. 

이와 같이 도수를 정리하면, 전체 데이터의 분포와 패턴을 쉽게 파악할 수 있다.

 

상대 도수

  • 전체 데이터 중에서 특정 값이나 계급이 차지하는 비율
  • 즉, 해당 값이나 계급의 도수(빈도)를 전체 데이터의 개수로 나눈 값
  • 모든 상대도수의 합은 1 또는 100%

위 예시에서 각 점수 범위(계급)의 상대도수는 그 점수 범위에 속하는 학생 수가 전체 학생 수에서 차지하는 비율을 나타낸다.

 

상대도수를 사용하면, 다양한 크기의 데이터 집합을 비교할 때 유용하다. 예를 들어, 두 학급의 시험 점수 분포를 비교할 때, 학생 수가 다르더라도 상대도수를 통해 어느 학급이 더 높은 점수 범위에 집중되어 있는지를 알 수 있다.

 

 

도수분포표

  • 데이터 집합 내의 다양한 값들이나 계급별로 도수를 정리한 표
  • 각 값이나 계급이 얼마나 자주 발생하는지를 보여주며, 데이터의 분포를 이해하는 데 도움을 줌

이 표에서 '계급'은 점수 범위를 나타내고, '도수'는 그 범위에 속하는 학생 수를, '상대도수'는 전체 학생 중 해당 범위에 속하는 학생의 비율을, '누적도수'는 해당 계급까지의 도수를 누적한 값을 의미한다.

 

도수분포표를 사용하면, 대량의 데이터를 쉽게 요약하고 이해할 수 있다. 예를 들어, 위의 표에서는 대부분의 학생들이 50점에서 69점 사이에 분포해 있음을 한눈에 파악할 수 있다. 

 

히스토그램

  • 데이터의 분포를 시각적으로 나타내는 그래프 중 하나로, 도수분포표를 바탕으로 만들어짐.
  • 데이터의 분포, 중심 경향, 분산 정도 등을 시각적으로 쉽게 이해할 수 있음.

 

반응형