반응형
변량
- 데이터의 개별 값

. 예를 들어, 한 반의 학생들의 시험 점수를 조사했다면, 각 학생의 점수가 바로 변량이다.
계급
- 비슷한 변량을 범위별로 나눈 그룹
- 데이터를 그룹화할 때 사용

예를 들어, 0점에서 100점까지 분포된 학생들의 시험 점수를 10점 단위로 나누어 계급을 만들 수 있다.
이렇게 계급을 활용하면 전체 학생들의 성적 분포를 쉽게 이해할 수 있다.
도수
- 특정 데이터 값이나 계급이 나타나는 횟수

위 데이터에서는 각 계급에 속하는 학생 수가 그 계급의 도수이다.
이와 같이 도수를 정리하면, 전체 데이터의 분포와 패턴을 쉽게 파악할 수 있다.
상대 도수
- 전체 데이터 중에서 특정 값이나 계급이 차지하는 비율
- 즉, 해당 값이나 계급의 도수(빈도)를 전체 데이터의 개수로 나눈 값
- 모든 상대도수의 합은 1 또는 100%

위 예시에서 각 점수 범위(계급)의 상대도수는 그 점수 범위에 속하는 학생 수가 전체 학생 수에서 차지하는 비율을 나타낸다.
상대도수를 사용하면, 다양한 크기의 데이터 집합을 비교할 때 유용하다. 예를 들어, 두 학급의 시험 점수 분포를 비교할 때, 학생 수가 다르더라도 상대도수를 통해 어느 학급이 더 높은 점수 범위에 집중되어 있는지를 알 수 있다.
도수분포표
- 데이터 집합 내의 다양한 값들이나 계급별로 도수를 정리한 표
- 각 값이나 계급이 얼마나 자주 발생하는지를 보여주며, 데이터의 분포를 이해하는 데 도움을 줌

이 표에서 '계급'은 점수 범위를 나타내고, '도수'는 그 범위에 속하는 학생 수를, '상대도수'는 전체 학생 중 해당 범위에 속하는 학생의 비율을, '누적도수'는 해당 계급까지의 도수를 누적한 값을 의미한다.
도수분포표를 사용하면, 대량의 데이터를 쉽게 요약하고 이해할 수 있다. 예를 들어, 위의 표에서는 대부분의 학생들이 50점에서 69점 사이에 분포해 있음을 한눈에 파악할 수 있다.
히스토그램
- 데이터의 분포를 시각적으로 나타내는 그래프 중 하나로, 도수분포표를 바탕으로 만들어짐.
- 데이터의 분포, 중심 경향, 분산 정도 등을 시각적으로 쉽게 이해할 수 있음.

반응형
'DATA' 카테고리의 다른 글
| 마케터를 위한 통계 | 마케터한테 기본적인 통계 기초가 필요한 이유 (0) | 2024.03.12 |
|---|---|
| 마케터를 위한 실무 SQL 노트 ④ JOIN (0) | 2023.02.26 |
| 마케터를 위한 실무 SQL 노트 ③ GROUP BY , HAVING , ORDER BY (0) | 2023.02.14 |
| 마케터를 위한 실무 SQL 노트 ② SELECT,WHERE (0) | 2023.02.12 |
| 마케터를 위한 실무 SQL 노트 ① SQL을 공부해야 하는 이유 (0) | 2023.02.05 |