Expérience
Parcours professionnel en ingénierie logicielle.
Ingénieur Data & Cloud — Veille IA & Pipelines
Freelance— Freelance
- Pipeline de veille médiatique multi-sources : ingestion RSS, scraping, stockage BigQuery (Défis Sorbonne — Projet Hypatie)
- Architecture RAG avec fact-checking LLM : LangChain + FAISS + Groq / Llama 3 sur base de vérité
- Orchestration cloud serverless GCP : Cloud Scheduler + Cloud Run + BigQuery
Ingénieur Logiciel — Développement & Architecture Web
Freelance— Freelance
- Développement full-stack from scratch : Spring Boot + Next.js + PostgreSQL
- Audit de stacks legacy, migration vers architectures découplées modernes
- Sécurisation applicative : OWASP, RBAC, chiffrement, anti-injection SQL
- Dev Lead sur Défis Sorbonne — coordination d'une équipe de 3 développeurs
Ingénieur Logiciel & Data — Pipeline ETL Cloud-Native · Sécurité Batterie
Ampère s.a.s. — Renault Group— Stage de fin d'études
- Audit et rétro-ingénierie du système existant (SEADI) : script Python monolithique de 1 800 lignes, complexité O(n⁶), 7,5 Go de consommation mémoire, 2 400+ lignes dupliquées — identification formalisée des défaillances architecturales
- Refactoring vers architecture ETL modulaire 3 couches (Extract/Transform/Load) : modules spécialisés par format, patterns Factory/Strategy/Template Method, dataclasses typées avec validation métier, streaming processing (7,5 Go → maîtrisé)
- Conception et déploiement autonome d'une architecture cloud-native GCP end-to-end : Cloud Storage, Cloud Run serverless, BigQuery — validée par l'Architecte Data IA et approuvée en comité technique CTT Renault
- CI/CD GitLab multi-stage avec Kaniko (sans daemon Docker), registry Renault corporat, images Docker optimisées de 2,1 Go à 180 Mo par multi-stage builds
- Parsing industriel multi-format : PDF (PyPDF2/pdfplumber), Excel (openpyxl), CAN/BLF (cantools) — classification hiérarchique par regex adaptatifs, IDs déterministes, suite de régression sur 200 rapports de référence
Ingénieur Recherche — Rétro-ingénierie & Évaluation de générateur JSON
CNRS / Laboratoire LIP6— Stage de recherche
- Rétro-ingénierie complète du générateur DataGen (code source JavaScript non documenté) via débogueur WebStorm — reconstruction du pipeline interne en 5 étapes
- Modélisation et documentation des mécanismes de traitement par type (string, number, object, array) et des connecteurs logiques (allOf, oneOf, anyOf, not)
- Migration de schémas JSON issus de 4 drafts différents (v4, v6, v7, 2019-09) vers le draft 2020-12 sur un corpus de 6 datasets distincts
- Développement d'un pipeline d'expérimentation automatisé : génération de masse, collecte d'erreurs, validation via json-schema-validator (Java/Jackson), classification
- Évaluation comparative sur 6 099 instances issues de datasets réels : Snowplow, WashingtonPost, Kubernetes, GitHub, Containment, Handwritten
Engagement
Paris 2024 — JOP
IT Volunteer (Software & Hardware)
Assistance pour le système de résultat sur site (OVRS).