개발로그필름
[데이터 TIL] 히트맵을 알아보자 본문
728x90
반응형
SMALL
📌 히트맵(Heatmap)이란?
히트맵(Heatmap)은 데이터를 색상으로 표현하여 쉽게 패턴을 파악할 수 있도록 도와주는 시각화 기법
히트맵은 데이터 값이 클수록 진한 색상, 값이 작을수록 연한 색상을 사용하여 한눈에 데이터의 변화를 파악할 수 있다
🔥 히트맵의 핵심 개념
1️⃣ 색상(Color)으로 데이터를 표현
• 값이 클수록 진한 색, 값이 작을수록 연한 색을 사용
• 예) 기온이 높은 곳을 빨간색, 낮은 곳을 파란색으로 표현
2️⃣ 표 형태의 데이터에 많이 사용
• 행(row)과 열(column)로 이루어진 2차원 데이터를 시각화
• 예) 성적표, 매출 분석, 상관 관계 분석 등에 사용
3️⃣ 패턴과 관계를 쉽게 파악 가능
• 색의 변화를 통해 어떤 값이 높은지, 낮은지 직관적으로 이해할 수 있음
• 복잡한 수치 데이터를 그래프보다 더 쉽게 확인 가능
반응형
🎯 히트맵의 대표적인 예시
✅ 1. 데이터 값 크기에 따른 히트맵
예시: 지역별 날씨(기온) 데이터
월 | 화 | 수 | 목 | 금 | |
서울 | 30 | 31 | 29 | 28 | 33 |
부산 | 25 | 26 | 27 | 24 | 28 |
대구 | 32 | 33 | 31 | 30 | 34 |
➡ 이 데이터를 히트맵으로 표현하면?
• 가장 기온이 높은 34도(대구 금요일)는 진한 빨간색
• 가장 낮은 24도(부산 목요일)는 연한 파란색
→ 이렇게 색상을 사용해 데이터를 쉽게 이해할 수 있다
✅ 2. 상관 관계 히트맵 (Correlation Heatmap)
히트맵은 변수 간의 관계(상관 관계)를 나타낼 때도 자주 사용
✅ 3. 예제 Python 코드
# 상관 관계 계산
corr = data.corr()
# 히트맵 생성
plt.figure(figsize=(8,6))
sns.heatmap(corr, annot=True, cmap='coolwarm', fmt=".2f")
plt.title("히트맵")
plt.show()
✔ sns.heatmap()을 사용하여 상관 관계를 히트맵으로 표현
✔ cmap='coolwarm' → 파란색(음의 상관), 빨간색(양의 상관) 사용
✔ annot=True → 숫자 표시
반응형
LIST
'데이터분석가 > 데이터 TIL' 카테고리의 다른 글
[데이터 TIL] pivot_table() (0) | 2025.02.07 |
---|---|
[데이터 TIL] Pair Plot에 대해 알아보자 (0) | 2025.02.07 |
[데이터 TIL] 수치형 데이터와 범주형 데이터의 차이 (0) | 2025.02.07 |
[데이터 TIL] 칼럼별 결측치 비율 확인하기 (0) | 2025.02.06 |
[데이터 TIL] pandas에서 CSV 파일을 읽을 때 한글 인코딩 문제 해결 (0) | 2025.02.06 |
Comments