Pandas 3.0 데이터 전처리 완벽 가이드: 결측값, 이상치, 정제 실전 기법
pandas 3.0 기반 데이터 전처리 실전 가이드. 결측값 처리, 이상치 탐지, 텍스트 정제, 중복 제거, 타입 변환, 파이프라인 자동화까지 현업에서 바로 쓸 수 있는 코드 예제를 단계별로 다룹니다.
Daniel is a staff data engineer with 13 years across fintech and logistics. He spent four years at Plaid building the transaction-enrichment pipeline (Python + Kafka + Snowflake), three years before that at Flexport on the freight-visibility data platform, and started his career at IBM doing DB2 performance work he still grudgingly draws on. He writes about the gluework of modern Python data stacks: Prefect 2 flow design, dbt run orchestration from Python, Pydantic-based contract validation between Bronze and Silver layers, and the operational realities of running polars in containers with strict memory limits. He has contributed patches to dbt-core and to the prefect-snowflake integration. Daniel is based in Lagos and Lisbon depending on the quarter, holds AWS Solutions Architect Professional, and writes a small newsletter about data-platform postmortems.
pandas 3.0 기반 데이터 전처리 실전 가이드. 결측값 처리, 이상치 탐지, 텍스트 정제, 중복 제거, 타입 변환, 파이프라인 자동화까지 현업에서 바로 쓸 수 있는 코드 예제를 단계별로 다룹니다.
Matplotlib, Seaborn, Plotly — Python 시각화의 3대 핵심 라이브러리를 실전 코드와 함께 완벽 정리했습니다. 접근성 컬러 사이클부터 인터랙티브 대시보드까지, 실무에서 바로 쓸 수 있는 시각화 노하우를 담았습니다.