개발로그필름
한 번에 이해되는 사분위수 계산하는 방법 본문
728x90
반응형
SMALL
반응형
ex) 점수 분포
50, 60, 74, 80, 81, 82, 92, 100
* 이미 오름차순 정렬되어있다 가정
사분위수란?
전체 데이터를 4등분해서 그 경계가 되는 특정 위치의 숫자를 구하는 것
- Q1 (1사분위수): 아래에서 25% 지점
- Q3 (3사분위수): 아래에서 75% 지점
1사분위수 위치 구하기
데이터 개수: 8개
(8 - 1) × 0.25 = 7 × 0.25 = 1.75
n-1 을 하는 이유: 데이터 값 사이 간격을 기준으로 하기 때문
즉 1사분위수는 1과 2 사이의 75%에 위치해 있다 (1.75)
1사분위수 계산하기
위 데이터 기준
- 1번 인덱스 값 = 60
- 2번 인덱스 값 = 74
60과 74 사이에서 75%쯤 간 숫자니까 아래와 같이 계산
Q1 = 60 + (74 - 60) × 0.75
= 60 + 14 × 0.75
= 60 + 10.5
= 70.5
위의 1사분위수 구한 것처럼 3사분위수도 구해보면,
(8 - 1) × 0.75 = 7 × 0.75 = 5.25
5번과 6번 인덱스 사이 25%에 위치
- 5번 인덱스 = 82
- 6번 인덱스 = 92
Q3 = 82 + (92 - 82) × 0.25
= 82 + 10 × 0.25
= 82 + 2.5
= 84.5
3사분위수는 84.5
완벽 이해 완료 👍🏻
반응형
LIST
'데이터분석' 카테고리의 다른 글
Docker + MySQL + Jupyter 연동 완전 정복 가이드 (2025 최신) (3) | 2025.06.10 |
---|---|
[데이터 분석] AARRR 프레임워크 (4) | 2025.06.08 |
Python으로 데이터 분석을 다 할 수 있는데 왜 SQL 역량이 필요할까? (0) | 2025.05.09 |
퍼널분석이란? 코호트분석과 다른 점은? (0) | 2025.05.08 |
코호트 분석 개념 및 예시, 사용 방법 (0) | 2025.05.07 |
Comments