Expérience
Parcours professionnel en ingénierie logicielle.
Ingénieur Data & Cloud
Apprenez-les-tous- Freelance
- Pipeline cloud-native GCP pour automatiser la production de fiches espèces scientifiquement fiables à partir de sources hétérogènes multi-formats (vidéos, images, JSON, texte) issues de bases officielles (INPN, GBIF, MNHN)
- Conception et déploiement d'un pipeline d'ingestion multi-sources sur GCP : structuration, nettoyage, stockage analytique BigQuery
- Architecture RAG pour validation factuelle automatisée entre sources scientifiques : LangChain + FAISS pour la recherche vectorielle, LLM pour le raisonnement et la détection de contradictions inter-sources
- Orchestration serverless Cloud Scheduler + Cloud Run, traitement batch des médias avec pipeline d'extraction de métadonnées
Développeur Fullstack
Apprenez-les-tous- Freelance
- Refonte complète de la plateforme d'un guide naturaliste en ligne - 10 000+ abonnés, 500 000+ vues - depuis un site vitrine statique vers une application web full-stack évolutive
- Encyclopédie naturaliste : module de création et d'édition de fiches espèces (critères d'identification, habitat, galerie média, liens épisodes associés), organisation par groupes taxonomiques, recherche interne
- Boutique & paiement : catalogue produits avec intégration Stripe Checkout, interface d'administration pour la gestion du stock
- Back-office complet : gestion des fiches encyclopédiques, des épisodes et de la boutique - interface pensée pour des utilisateurs non techniques (équipe de naturalistes)
Ingénieur Logiciel - Développement & Architecture Web
Freelance- Freelance
- Développement full-stack from scratch : Spring Boot + Next.js + PostgreSQL
- Audit de stacks legacy, migration vers architectures découplées modernes
- Sécurisation applicative : OWASP, RBAC, chiffrement, anti-injection SQL
- Dev Lead sur Défis Sorbonne - coordination d'une équipe de 3 développeurs
Ingénieur Logiciel & Data - Pipeline ETL Cloud-Native · Sécurité Batterie
Ampère s.a.s. - Renault Group- Stage de fin d'études
- Audit et rétro-ingénierie du système existant (SEADI) : script Python monolithique de 1 800 lignes, complexité O(n⁶), 7,5 Go de consommation mémoire, 2 400+ lignes dupliquées - identification formalisée des défaillances architecturales
- Refactoring vers architecture ETL modulaire 3 couches (Extract/Transform/Load) : modules spécialisés par format, patterns Factory/Strategy/Template Method, dataclasses typées avec validation métier, streaming processing (7,5 Go → maîtrisé)
- Conception et déploiement autonome d'une architecture cloud-native GCP end-to-end : Cloud Storage, Cloud Run serverless, BigQuery - validée par l'Architecte Data IA et approuvée en comité technique CTT Renault
- CI/CD GitLab multi-stage avec Kaniko (sans daemon Docker), registry Renault corporat, images Docker optimisées de 2,1 Go à 180 Mo par multi-stage builds
- Parsing industriel multi-format : PDF (PyPDF2/pdfplumber), Excel (openpyxl), CAN/BLF (cantools) - classification hiérarchique par regex adaptatifs, IDs déterministes, suite de régression sur 200 rapports de référence
Ingénieur Recherche - Rétro-ingénierie & Évaluation de générateur JSON
CNRS / Laboratoire LIP6- Stage de recherche
- Rétro-ingénierie complète du générateur DataGen (code source JavaScript non documenté) via débogueur WebStorm - reconstruction du pipeline interne en 5 étapes
- Modélisation et documentation des mécanismes de traitement par type (string, number, object, array) et des connecteurs logiques (allOf, oneOf, anyOf, not)
- Migration de schémas JSON issus de 4 drafts différents (v4, v6, v7, 2019-09) vers le draft 2020-12 sur un corpus de 6 datasets distincts
- Développement d'un pipeline d'expérimentation automatisé : génération de masse, collecte d'erreurs, validation via json-schema-validator (Java/Jackson), classification
- Évaluation comparative sur 6 099 instances issues de datasets réels : Snowplow, WashingtonPost, Kubernetes, GitHub, Containment, Handwritten
Engagement
Paris 2024 - JOP
IT Volunteer (Software & Hardware)
Assistance pour le système de résultat sur site (OVRS).