🇬🇧 English version 🖨 Print / Save as PDF

Álvaro GONZÁLEZ SÁNCHEZ

Backend & Data Engineer | Python · FastAPI · AWS · Azure · Databricks

Profiel

Backend en Data Engineer met een sterke achtergrond in Python, API-ontwikkeling en cloud-gebaseerde data-architecturen. Ervaren in het bouwen van schaalbare backend-toepassingen, het verwerken van tijdreeksdata en het automatiseren van complexe workflows. Combineert software-engineering met een analytische ingenieursmindset en jarenlange ervaring in modellering en data-intensieve projecten. Gedreven om robuuste, veilige en performante systemen te bouwen binnen een dynamisch team.

Werkervaring

Python Developer & Data Engineer 08/2025 – heden
Zelfstandig
  • Verdieping van kennis en ervaring in Python, data engineering en cloud-architecturen via persoonlijke projecten en gerichte opleidingen.
  • Ontwikkeling van het IoT Monitoring Platform (zie Projecten).
Freelance Data Engineer 02/2025 – 07/2025
Zelfstandig — Peru & Bolivia
  • Data-analyse en softwareontwikkeling voor projecten in Zuid-Amerika (milieu- en watersector).
  • Verwerking en analyse van discrete en continue datasets met Python.
Programmeur 03/2023 – 01/2025
Link / Manage Count-e — Leuven
  • Backend ontwikkeling en onderhoud van een schoolbeheersysteem met een complexe relationele database (350+ tabellen).
  • Automatisering van administratieve bedrijfsprocessen in samenwerking met multidisciplinaire teams.
  • Werkte met grote, gestructureerde datasets en droeg bij aan de stabiliteit en uitbreidbaarheid van het systeem.
Adviseur grond- en oppervlaktewater 03/2022 – 12/2022
Antea Group Belgium
  • Analyse van hydrologische data en modellering van grondwaterstromen.
  • Ruimtelijke analyses met ArcGIS Pro en QGIS.
  • Adviesrapporten voor beleidsmakers en bedrijven rond waterbeheer.
Zorg voor gezin 2019 – 2021
Onderzoeker – Hydrodynamische modellering 05/2013 – 08/2019
Vrije Universiteit Brussel
  • Hydrodynamische modellering van de Zeeschelde.
  • Ontwikkeling van numerieke modellen in Fortran.
Bijzonder Academisch Personeel (BAP) 11/2009 – 04/2013
Vrije Universiteit Brussel — Brussel
Assistent hydrologie en waterbouwkunde 06/2009 – 07/2009
Soresma — België
Hydraulisch ingenieur 08/2006 – 08/2007
Zorrilla Construcciones — Bolivia
Onderzoeksassistent & Assistent Programmeren 07/2004 – 07/2006
Universidad Mayor de San Simón — Bolivia

Projecten

IoT Monitoring Platformgithub.com/GonzalezSanchez/iot-monitoring-platform · iot.gonzalezsanchez.dev
Project 1a: Serverless Ingestion · 12/2025 – 01/2026
Python · AWS Lambda · API Gateway · DynamoDB · CloudFormation · GitHub Actions
  • Serverless REST API voor real-time ingestie van sensorgebeurtenissen (temperatuur, vochtigheid, bezetting, beweging) met drempelgebaseerde anomaliedetectie.
  • Clean layered architecture (models → services → repositories). Volledige infrastructuur als code met CloudFormation. Deployed naar AWS via CI/CD.
Project 1b: Gecontaineriseerde Ingestion · 01/2026 – 02/2026
Python · FastAPI · Docker · nginx · AWS DynamoDB · React · Cloudflare · OpenTelemetry · Datadog · GitHub Actions
  • Zelfde bedrijfslogica als 1a, heringezet als een gecontaineriseerde FastAPI-applicatie — demonstreert de scheiding van domeinlogica en infrastructuur.
  • Live op iot.gonzalezsanchez.dev via Docker Compose + Cloudflare tunnel. React dashboard met 30s auto-refresh en live event submission.
  • End-to-end observability geïmplementeerd met OpenTelemetry auto-instrumentatie en OTel Collector → Datadog APM: gedistribueerde traces met automatische DynamoDB child span detectie, log-trace correlatie en Watchdog anomaliedetectie — zonder handmatige instrumentatie.
  • Docker-images gebouwd en gepusht naar GitHub Container Registry bij elke merge naar main.
Project 2a: Behavior Analyzer (AWS Serverless) · 02/2026 – 04/2026
Python · AWS Step Functions · Lambda · Aurora Serverless v2 · EventBridge · Terraform · Secrets Manager · GitHub Actions
  • Serverless ETL-pipeline: haalt historische sensordata op uit DynamoDB, detecteert bezettingspatronen, temperatuurtrends en anomalieën, slaat resultaten op in Aurora Serverless v2 (PostgreSQL).
  • Volledige infrastructuur ingericht met Terraform. Draait op aanvraag om AWS-kosten te minimaliseren (~$15/maand actief, schaalt naar nul bij inactiviteit).
  • Unit-, integratie- en regressietests (pytest + moto); 80%+ coverage afgedwongen op elke push via GitHub Actions.
Project 2b: Behavior Analyzer (Data Engineering) · 04/2026 – 05/2026
Python · Apache Airflow · PySpark · dbt · AWS S3 · PostgreSQL · GeoPandas · Power BI · OpenTelemetry · Grafana Cloud · Jenkins · Terraform · Docker
  • Data engineering-pipeline met Medallion-architectuur (Bronze → Silver → Gold): raw Parquet (DynamoDB scan) → processed Parquet (gevalideerd, opgeschoond) → PostgreSQL serving layer via dbt (staging views + gematerialiseerde marts met source tests).
  • PySpark-analyses: bezettingspatroondetectie (window-aggregatie), temperatuurtrend-regressie (Spark SQL regr_slope), z-score anomaliedetectie (stddev_pop — medium ≥ 3, hoog ≥ 5), ruimtelijke hotspot-aggregatie per gebouw (GeoPandas, EPSG:4326).
  • Observability: OTel Collector → Grafana Cloud (Mimir metrics + Loki logs) — custom tellers per pipeline-fase, Airflow StatsD-metrics, PostgreSQL-metrics via postgres-exporter.
  • Georchestreerd door Apache Airflow (wekelijks schema). Gedeployed via een 9-staps Jenkins declaratieve CD-pipeline. Infrastructuur ingericht met Terraform (S3 + IAM). Power BI-dashboard live op iot.gonzalezsanchez.dev.
  • 94 unit tests (pytest + PySpark in-process). CI-pipeline met PySpark-tests (Java 17), Airflow DAG-tests, dbt parse en terraform validate — allemaal groen op elke push.

Open Source

PynamoDB
Python · AWS DynamoDB
  • Bug fix: Enum-waarden werden onterecht afgewezen als standaardwaarde voor modelattributen door een onvolledige typevalidatielijst. · PR #1302

Opleiding

Master Water Resources Engineering
KU Leuven
2009 · Magna cum laude
Enterprise Java Ontwikkelaar
VDAB
2021–2022
Bachelor Ingenieurswetenschappen
Univ. Mayor de San Simón (Bolivia)
2004
Specialisatie Milieubeheer
Universidad de Beni (Bolivia)
2007
Effective Scientific Communication (6 ECTS)
Vrije Universiteit Brussel
2014
Statistics for PhD Students (6 ECTS)
Vrije Universiteit Brussel
2012

Certificaten (2025 –)

LinkedIn · Apache Airflow
LinkedIn · Claude AI: Datenanalyse, Programmierung, MCP
LinkedIn · Build with AI: API with CI/CD in Claude Code
LinkedIn · Docker Compose
LinkedIn · Build REST APIs with FastAPI
LinkedIn · Building RESTful APIs with Flask
HarvardX · Intro to Data Science with Python
Microsoft · Power BI: Data Models & Reports

Volledige lijst op LinkedIn.

Vaardigheden

Backend & Development
Python, FastAPI, Flask, Java (Spring Boot), REST APIs, ETL-pipelines, OOP, TDD
Cloud & DevOps
AWS (Lambda, API Gateway, S3, DynamoDB, Aurora Serverless v2, CloudFormation, Step Functions, EventBridge, Secrets Manager, CloudWatch, SNS) · Azure (Databricks, ADLS Gen2, Key Vault, Event Hubs, Monitor) · Terraform, Docker, Docker Compose, Kubernetes, Nginx, GitHub Actions, Jenkins, Cloudflare, CI/CD, IaC
Data Engineering
SQL (PostgreSQL, MySQL), MongoDB · PySpark, Databricks, Delta Lake, Unity Catalog, Pandas, NumPy, Scikit-learn, GeoPandas · Apache Airflow, dbt, Auto Loader, ETL/ELT · Grafana Cloud, Power BI, Tableau
GIS
ArcGIS Pro, ArcGIS API for Python, QGIS, FME
Overige
Git, Scrum/Agile, JUnit, Maven, HEC-RAS, MODFLOW, Fortran

Talen

Spaans — moedertaal
Engels — C1
Nederlands — C1
Duits — A2
Frans — A2