Daniel Okonkwo

Daniel is a staff data engineer with 13 years across fintech and logistics. He spent four years at Plaid building the transaction-enrichment pipeline (Python + Kafka + Snowflake), three years before that at Flexport on the freight-visibility data platform, and started his career at IBM doing DB2 performance work he still grudgingly draws on. He writes about the gluework of modern Python data stacks: Prefect 2 flow design, dbt run orchestration from Python, Pydantic-based contract validation between Bronze and Silver layers, and the operational realities of running polars in containers with strict memory limits. He has contributed patches to dbt-core and to the prefect-snowflake integration. Daniel is based in Lagos and Lisbon depending on the quarter, holds AWS Solutions Architect Professional, and writes a small newsletter about data-platform postmortems.

Статті автора Daniel Okonkwo

Інженерія ознак (Feature Engineering) у Python: практичний посібник з pandas, scikit-learn та feature-engine
Посібники

Інженерія ознак (Feature Engineering) у Python: практичний посібник з pandas, scikit-learn та feature-engine

Повний практичний посібник з інженерії ознак у Python: числові трансформації, кодування категорій, обробка пропусків, автоматизація з feature-engine та Featuretools, побудова пайплайнів scikit-learn 1.8.

Daniel Okonkwo 16 хв читання
Автоматизоване очищення даних у Python: pandas 3.0, pyjanitor та pandera
Посібники

Автоматизоване очищення даних у Python: pandas 3.0, pyjanitor та pandera

Як побудувати автоматизований пайплайн очищення даних у Python за допомогою pandas 3.0 (PyArrow, Copy-on-Write, .pipe()), pyjanitor для ланцюгового очищення та pandera для валідації якості. Покрокові приклади з кодом.

Daniel Okonkwo 17 хв читання
Сучасні ML-пайплайни з scikit-learn 1.8: від підготовки даних до GPU-прискорення
Посібники

Сучасні ML-пайплайни з scikit-learn 1.8: від підготовки даних до GPU-прискорення

Покроковий посібник зі створення ML-пайплайнів у scikit-learn 1.8: Pipeline, ColumnTransformer, TargetEncoder, GPU-прискорення через Array API, Metadata Routing, оптимізація порогів та наскрізний приклад класифікації.

Daniel Okonkwo 20 хв читання