Sofia Castellanos

Sofia is a Python data engineer with 7 years building ingestion and transformation systems for media and adtech. She spent three years at Spotify on the personalization-data team, where she shipped a streaming-to-batch reconciliation pipeline that processes around 90 billion playback events per day, and two years before that at The New York Times on the subscriber-analytics platform. She focuses her writing on production pandas patterns (chunked reads, categorical memory tricks, Arrow interop), Airflow 2.x task groups, and the kinds of dbt + Python hybrid pipelines that show up once your warehouse bill stops being cute. She also maintains pyspark-helpers, a small library for column-name munging she keeps porting between jobs. Sofia is based in Madrid, originally from Bogota, and a relentless defender of type hints in notebook code.

บทความโดย Sofia Castellanos

จัดการข้อมูลหายไป (Missing Data) ใน pandas 3.0 — dropna, fillna, interpolate ฉบับสมบูรณ์
บทช่วยสอน

จัดการข้อมูลหายไป (Missing Data) ใน pandas 3.0 — dropna, fillna, interpolate ฉบับสมบูรณ์

คู่มือจัดการข้อมูลหายไปใน pandas 3.0 ฉบับสมบูรณ์ ครอบคลุม dropna, fillna, interpolate, NaN vs pd.NA, scikit-learn Imputer และ decision framework เลือกวิธีที่เหมาะสม พร้อมโค้ดตัวอย่างใช้งานจริง

Sofia Castellanos 12 นาทีในการอ่าน
รวม DataFrame ด้วย merge(), join() และ concat() ใน pandas 3.0 — คู่มือฉบับสมบูรณ์
บทช่วยสอน

รวม DataFrame ด้วย merge(), join() และ concat() ใน pandas 3.0 — คู่มือฉบับสมบูรณ์

เรียนรู้วิธีรวม DataFrame ใน pandas 3.0 ด้วย merge(), join() และ concat() พร้อมฟีเจอร์ Anti Join ใหม่ (left_anti, right_anti) ตัวอย่างโค้ดใช้งานจริง และ 5 ข้อผิดพลาดที่ต้องระวัง

Sofia Castellanos 15 นาทีในการอ่าน