Werkervaring
Python Developer & Data Engineer
08/2025 – heden
Zelfstandig
- Verdieping van kennis en ervaring in Python, data engineering en cloud-architecturen via persoonlijke projecten en gerichte opleidingen.
- Ontwikkeling van het IoT Monitoring Platform (zie Projecten).
Freelance Data Engineer
02/2025 – 07/2025
Zelfstandig — Peru & Bolivia
- Data-analyse en softwareontwikkeling voor projecten in Zuid-Amerika (milieu- en watersector).
- Verwerking en analyse van discrete en continue datasets met Python.
Programmeur
03/2023 – 01/2025
Link / Manage Count-e — Leuven
- Backend ontwikkeling en onderhoud van een schoolbeheersysteem met een complexe relationele database (350+ tabellen).
- Automatisering van administratieve bedrijfsprocessen in samenwerking met multidisciplinaire teams.
- Werkte met grote, gestructureerde datasets en droeg bij aan de stabiliteit en uitbreidbaarheid van het systeem.
Adviseur grond- en oppervlaktewater
03/2022 – 12/2022
Antea Group Belgium
- Analyse van hydrologische data en modellering van grondwaterstromen.
- Ruimtelijke analyses met ArcGIS Pro en QGIS.
- Adviesrapporten voor beleidsmakers en bedrijven rond waterbeheer.
Zorg voor gezin
2019 – 2021
Onderzoeker – Hydrodynamische modellering
05/2013 – 08/2019
Vrije Universiteit Brussel
- Hydrodynamische modellering van de Zeeschelde.
- Ontwikkeling van numerieke modellen in Fortran.
Bijzonder Academisch Personeel (BAP)
11/2009 – 04/2013
Vrije Universiteit Brussel — Brussel
Assistent hydrologie en waterbouwkunde
06/2009 – 07/2009
Soresma — België
Hydraulisch ingenieur
08/2006 – 08/2007
Zorrilla Construcciones — Bolivia
Onderzoeksassistent & Assistent Programmeren
07/2004 – 07/2006
Universidad Mayor de San Simón — Bolivia
Projecten
IoT Monitoring Platform —
github.com/GonzalezSanchez/iot-monitoring-platform ·
iot.gonzalezsanchez.dev
Project 1a: Serverless Ingestion · 12/2025 – 01/2026
Python · AWS Lambda · API Gateway · DynamoDB · CloudFormation · GitHub Actions
- Serverless REST API voor real-time ingestie van sensorgebeurtenissen (temperatuur, vochtigheid, bezetting, beweging) met drempelgebaseerde anomaliedetectie.
- Clean layered architecture (models → services → repositories). Volledige infrastructuur als code met CloudFormation. Deployed naar AWS via CI/CD.
Project 1b: Gecontaineriseerde Ingestion · 01/2026 – 02/2026
Python · FastAPI · Docker · nginx · AWS DynamoDB · React · Cloudflare · OpenTelemetry · Datadog · GitHub Actions
- Zelfde bedrijfslogica als 1a, heringezet als een gecontaineriseerde FastAPI-applicatie — demonstreert de scheiding van domeinlogica en infrastructuur.
- Live op iot.gonzalezsanchez.dev via Docker Compose + Cloudflare tunnel. React dashboard met 30s auto-refresh en live event submission.
- End-to-end observability geïmplementeerd met OpenTelemetry auto-instrumentatie en OTel Collector → Datadog APM: gedistribueerde traces met automatische DynamoDB child span detectie, log-trace correlatie en Watchdog anomaliedetectie — zonder handmatige instrumentatie.
- Docker-images gebouwd en gepusht naar GitHub Container Registry bij elke merge naar main.
Project 2a: Behavior Analyzer (AWS Serverless) · 02/2026 – 04/2026
Python · AWS Step Functions · Lambda · Aurora Serverless v2 · EventBridge · Terraform · Secrets Manager · GitHub Actions
- Serverless ETL-pipeline: haalt historische sensordata op uit DynamoDB, detecteert bezettingspatronen, temperatuurtrends en anomalieën, slaat resultaten op in Aurora Serverless v2 (PostgreSQL).
- Volledige infrastructuur ingericht met Terraform. Draait op aanvraag om AWS-kosten te minimaliseren (~$15/maand actief, schaalt naar nul bij inactiviteit).
- Unit-, integratie- en regressietests (pytest + moto); 80%+ coverage afgedwongen op elke push via GitHub Actions.
Project 2b: Behavior Analyzer (Data Engineering) · 04/2026 – 05/2026
Python · Apache Airflow · PySpark · dbt · AWS S3 · PostgreSQL · GeoPandas · Power BI · OpenTelemetry · Grafana Cloud · Jenkins · Terraform · Docker
- Data engineering-pipeline met Medallion-architectuur (Bronze → Silver → Gold): raw Parquet (DynamoDB scan) → processed Parquet (gevalideerd, opgeschoond) → PostgreSQL serving layer via dbt (staging views + gematerialiseerde marts met source tests).
- PySpark-analyses: bezettingspatroondetectie (window-aggregatie), temperatuurtrend-regressie (Spark SQL regr_slope), z-score anomaliedetectie (stddev_pop — medium ≥ 3, hoog ≥ 5), ruimtelijke hotspot-aggregatie per gebouw (GeoPandas, EPSG:4326).
- Observability: OTel Collector → Grafana Cloud (Mimir metrics + Loki logs) — custom tellers per pipeline-fase, Airflow StatsD-metrics, PostgreSQL-metrics via postgres-exporter.
- Georchestreerd door Apache Airflow (wekelijks schema). Gedeployed via een 9-staps Jenkins declaratieve CD-pipeline. Infrastructuur ingericht met Terraform (S3 + IAM). Power BI-dashboard live op iot.gonzalezsanchez.dev.
- 94 unit tests (pytest + PySpark in-process). CI-pipeline met PySpark-tests (Java 17), Airflow DAG-tests, dbt parse en terraform validate — allemaal groen op elke push.
Open Source
PynamoDB
Python · AWS DynamoDB
- Bug fix: Enum-waarden werden onterecht afgewezen als standaardwaarde voor modelattributen door een onvolledige typevalidatielijst. · PR #1302