목록전체 글 (222)
개발로그필름

from google.colab import filesuploaded = files.upload()✅ 구글 코랩에서 이 코드를 실행 시키면 내 컴퓨터 안의 파일들을 선택하라는 출력이 나온다 ➡️ 파일 선택해서 한꺼번에 여러 파일들을 업로드 하면 끝! 나는 8개 파일을 올렸는데 시간이 좀 걸리긴 하지만 일일히 파일 path 설정해서 하나하나 가져오는것보다는 편하다 :)

1. 데이터 구조 및 기본 정보 확인df.head(), df.info(), df.describe()로 데이터 전체 구조 파악컬럼별 데이터 타입, 결측치 여부, 기본 통계 확인 2. 결측치 및 이상치 확인df.isnull().sum()으로 결측치 확인Boxplot 또는 quantile로 이상치 분포 확인필요 시 간단한 결측치 처리 (제거 또는 평균/중앙값 대체) 3. 기초 통계 및 분포 확인수치형 변수: 히스토그램, 평균/중앙값/표준편차범주형 변수: value_counts()로 분포 확인카테고리 수가 너무 많거나 너무 적은 경우 파악 4. 변수 간 관계 탐색 (간단한 상관관계)corr()로 수치형 변수 간 상관관계 확인scatter plot 또는 pairplot 등으로 시각적으로 파악 ..

📌 구글 코랩(Google Colab)에서 구글 드라이브에 있는 파일을 연결해서 사용하는 기본 코드from google.colab import drivedrive.mount('/content/drive')✔️ 이 코드를 실행하면 처음에 인증 URL이 뜨고, 구글 계정 선택 후 인증 코드를 붙여넣으면 연결 완료 📁 구글 드라이브 안의 파일 경로 접근 방법import pandas as pdfile_path = '/content/drive/MyDrive/폴더명/파일명.csv'df = pd.read_csv(file_path)df.head() 이 뒤로 하고 싶은 EDA 하면 끄읏! 😊

Python에서 리스트를 다룰 때, 짧고 간결하게 새로운 리스트를 만들 수 있는 방법이 있다 리스트 컴프리헨션이란?기존 리스트나 반복 가능한(iterable) 객체를 기반으로, 새로운 리스트를 간단한 문법으로 만드는 방법일반적인 for 반복문을 한 줄로 표현할 수 있게 도와준다 ✅ 기본 문법[표현식 for 요소 in 반복가능한객체]🔁 기존 방식과 비교# 기존 방식result = []for i in range(5): result.append(i * 2)print(result) # [0, 2, 4, 6, 8]# 리스트 컴프리헨션result = [i * 2 for i in range(5)]print(result) # [0, 2, 4, 6, 8]두 코드 모두 같은 결과를 출력하지만, 리스트 컴프리헨션..

!pip install fake_useragent 역할웹 스크래핑 할 때, User-Agent 값을 랜덤으로 생성해주는 라이브러리User-Agent는 웹 브라우저나 장치 정보를 웹사이트에 전달하는 HTTP 헤더 중 하나일부 웹사이트는 특정 User-Agent(예: 봇, 자동화 요청)를 차단한다fake_useragent를 사용하면 매번 다른 User-Agent를 생성하여 스크래핑 차단을 피할 수 있다 1. fake_useragent 설치!pip install fake_useragent✔ !pip install → Jupyter Notebook에서 패키지 설치✔ fake_useragent → User-Agent를 랜덤으로 생성하는 라이브러리 2. fake_useragent 사용법from fake_use..

Python에서 오류를 처리할 때 try-except 블록을 자주 사용한다그런데 때로는 개발자가 직접 예외를 발생시켜야 할 때가 있다이때 사용하는 것이 바로 raise 문!! 1. raise란?Python에서 예외를 강제로 발생시키는 키워드특정 조건에서 프로그램이 원하는 방식으로 동작하도록 제어할 수 있다 기본적인 raise 사용법raise ValueError("잘못된 값이 입력되었습니다.")위 코드를 실행하면 아래와 같은 ValueError가 발생해 프로그램이 중단된다Traceback (most recent call last): File "", line 1, in ValueError: 잘못된 값이 입력되었습니다. 2. raise 문법raise 예외_클래스(예외_메시지)예외 클래스는 Pytho..

사람이 직접 웹사이트를 조작하는 대신, 프로그램을 이용해 웹사이트의 반복적인 작업을 자동으로 수행하는 기술예를 들면, 로그인 자동화, 데이터 크롤링, 버튼 클릭 자동화, 예약 시스템 등이 있다 1️⃣ 웹 자동화란? (기본 개념)웹사이트에서 우리가 하는 행동들은 대부분 마우스 클릭, 키보드 입력, 스크롤 등 반복적인 작업이 많다웹 자동화(Web Automation) 는 이런 반복적인 작업을 자동으로 실행하도록 도와주는 기술이다 💡 웹 자동화의 예시온라인 쇼핑몰에서 자동 로그인 & 상품 주문유튜브, 인스타그램, 트위터에서 자동 게시물 업로드 & 댓글 작성크롤링을 이용해 뉴스, 환율, 주식 가격 자동 수집자동으로 양식 입력(폼 작성) & 제출 버튼 클릭👉 웹 자동화는 Selenium, Playwri..

시간 데이터를 다룰 때 흔히 접하는 개념 중 하나가 DATETIME과 TIMESTAMP이다두 용어는 비슷해 보이지만, 실제로는 다른 개념이며 사용 목적도 다르다 1. DATETIME과 TIMESTAMP란?1.1 DATETIME이란?사람이 이해하기 쉬운 날짜 및 시간을 포함하는 데이터 타입일반적으로 년-월-일 시:분:초 형식으로 표현되며, 특정 시점을 직관적으로 나타낼 수 있다예시: 2025-03-13 15:30:00Python에서 DATETIME을 다룰 때는 datetime 모듈을 사용한다from datetime import datetimedt = datetime(2025, 3, 13, 15, 30, 0)print(dt) # 2025-03-13 15:30:00 1.2 TIMESTAMP란?197..