개발로그필름

df.groupby("id")["product"].apply(list).tolist() 본문

데이터분석가/데이터 TIL

df.groupby("id")["product"].apply(list).tolist()

yuullog 2025. 2. 4. 22:29
728x90
반응형
SMALL

df.groupby("id")["product"].apply(list).tolist()

=> id별 구매한 제품 product를 리스트 형태로 변환하는 코드

 

1. groupby("id")

- df를 id별로 그룹화한다

- 같은 고객 id를 가진 데이터끼리 묶인다

 

2. ["product"]

- product를 선택해서 고객별 구매한 제품만 추출한다

 

3. .apply(list)

- 각 고객이 구매한 제품(product)를 리스트 형태로 변환한다

- 즉, 같은 고객이 구매한 모든 product 값을 하나의 리스트로 저장한다

 

4. .tolist()

- 최종적으로 각 고객별 제품 리스트를 요소로 갖는 리스트를 생성한다

 

예제 데이터
import pandas as pd

# 예제 데이터 생성
data = {
    "id": [101, 101, 102, 102, 102, 103, 104, 104],
    "product": ["음료", "과자", "과자", "라면", "음료", "과자", "라면", "과자"]
}

customer_df = pd.DataFrame(data)
print(customer_df)

 

코드 실행
basket_data = customer_df.groupby("id")["product"].apply(list).tolist()
print(basket_data)

 

실행 결과
[['음료', '과자'], ['과자', '라면', '음료'], ['과자'], ['라면', '과자']]

- 각 고객이 구매한 제품이 리스트 형태로 저장된 것

반응형

- id가 101이면 "음료", "과자" 를 구매했으므로 ['음료', '과자']가 저장된 것

반응형
LIST