Python時系列データ分析 実践ガイド:pandas・statsmodels・Prophetで予測モデルを構築する
pandas 3.0の時系列機能、statsmodelsのSARIMAXモデル、Prophet 1.3の予測手法を実践コード付きで解説。ADF検定、季節分解、グリッドサーチによるパラメータ最適化、交差検証まで網羅した2026年対応ガイドです。
Sofia is a Python data engineer with 7 years building ingestion and transformation systems for media and adtech. She spent three years at Spotify on the personalization-data team, where she shipped a streaming-to-batch reconciliation pipeline that processes around 90 billion playback events per day, and two years before that at The New York Times on the subscriber-analytics platform. She focuses her writing on production pandas patterns (chunked reads, categorical memory tricks, Arrow interop), Airflow 2.x task groups, and the kinds of dbt + Python hybrid pipelines that show up once your warehouse bill stops being cute. She also maintains pyspark-helpers, a small library for column-name munging she keeps porting between jobs. Sofia is based in Madrid, originally from Bogota, and a relentless defender of type hints in notebook code.
pandas 3.0の時系列機能、statsmodelsのSARIMAXモデル、Prophet 1.3の予測手法を実践コード付きで解説。ADF検定、季節分解、グリッドサーチによるパラメータ最適化、交差検証まで網羅した2026年対応ガイドです。
Rustベースの次世代データフレームPolarsをpandasユーザー向けに徹底解説。Expression API、遅延評価、ストリーミング、GPU対応からETLパイプライン構築まで、コード例で実践的に学べます。
2026年1月リリースのpandas 3.0を徹底解説。Copy-on-Writeのデフォルト化、新しいstr dtype、pd.col()カラム式、日時解像度変更、Anti-Joinサポートなど、破壊的変更と移行手順を実践コード例とともに紹介します。