Expérience

Parcours professionnel en ingénierie logicielle.

Ingénieur Data & Cloud — Veille IA & Pipelines

FreelanceFreelance

  • Pipeline de veille médiatique multi-sources : ingestion RSS, scraping, stockage BigQuery (Défis Sorbonne — Projet Hypatie)
  • Architecture RAG avec fact-checking LLM : LangChain + FAISS + Groq / Llama 3 sur base de vérité
  • Orchestration cloud serverless GCP : Cloud Scheduler + Cloud Run + BigQuery
PythonPython
LangChainLangChain
FAISSFAISS
RAG
BigQueryBigQuery
Cloud RunCloud Run
Cloud SchedulerCloud Scheduler
Groq / Llama 3
Voir le détail →

Ingénieur Logiciel — Développement & Architecture Web

FreelanceFreelance

  • Développement full-stack from scratch : Spring Boot + Next.js + PostgreSQL
  • Audit de stacks legacy, migration vers architectures découplées modernes
  • Sécurisation applicative : OWASP, RBAC, chiffrement, anti-injection SQL
  • Dev Lead sur Défis Sorbonne — coordination d'une équipe de 3 développeurs
Spring BootSpring Boot
Next.jsNext.js
PostgreSQLPostgreSQL
RBAC
Anti-injection SQL
Voir le détail →

Ingénieur Logiciel & Data — Pipeline ETL Cloud-Native · Sécurité Batterie

Ampère s.a.s. — Renault GroupStage de fin d'études

  • Audit et rétro-ingénierie du système existant (SEADI) : script Python monolithique de 1 800 lignes, complexité O(n⁶), 7,5 Go de consommation mémoire, 2 400+ lignes dupliquées — identification formalisée des défaillances architecturales
  • Refactoring vers architecture ETL modulaire 3 couches (Extract/Transform/Load) : modules spécialisés par format, patterns Factory/Strategy/Template Method, dataclasses typées avec validation métier, streaming processing (7,5 Go → maîtrisé)
  • Conception et déploiement autonome d'une architecture cloud-native GCP end-to-end : Cloud Storage, Cloud Run serverless, BigQuery — validée par l'Architecte Data IA et approuvée en comité technique CTT Renault
  • CI/CD GitLab multi-stage avec Kaniko (sans daemon Docker), registry Renault corporat, images Docker optimisées de 2,1 Go à 180 Mo par multi-stage builds
  • Parsing industriel multi-format : PDF (PyPDF2/pdfplumber), Excel (openpyxl), CAN/BLF (cantools) — classification hiérarchique par regex adaptatifs, IDs déterministes, suite de régression sur 200 rapports de référence
Python 3.12Python 3.12
FastAPIFastAPI
Angular 18Angular 18
GCPGCP
Cloud RunCloud Run
BigQueryBigQuery
Cloud StorageCloud Storage
DockerDocker
KanikoKaniko
GitLab CI/CDGitLab CI/CD
YOLOv9YOLOv9
PyTorchPyTorch
OpenCVOpenCV
cantoolscantools
pdfplumberpdfplumber
openpyxlopenpyxl
SpotfireSpotfire
Azure CLIAzure CLI
Voir le détail →

Ingénieur Recherche — Rétro-ingénierie & Évaluation de générateur JSON

CNRS / Laboratoire LIP6Stage de recherche

  • Rétro-ingénierie complète du générateur DataGen (code source JavaScript non documenté) via débogueur WebStorm — reconstruction du pipeline interne en 5 étapes
  • Modélisation et documentation des mécanismes de traitement par type (string, number, object, array) et des connecteurs logiques (allOf, oneOf, anyOf, not)
  • Migration de schémas JSON issus de 4 drafts différents (v4, v6, v7, 2019-09) vers le draft 2020-12 sur un corpus de 6 datasets distincts
  • Développement d'un pipeline d'expérimentation automatisé : génération de masse, collecte d'erreurs, validation via json-schema-validator (Java/Jackson), classification
  • Évaluation comparative sur 6 099 instances issues de datasets réels : Snowplow, WashingtonPost, Kubernetes, GitHub, Containment, Handwritten
JavaScriptJavaScript
Node.jsNode.js
Java
PythonPython
JSON SchemaJSON Schema
DataGen
json-schema-faker
DockerDocker
WebStormWebStorm
IntelliJ IDEAIntelliJ IDEA
Voir le détail →

Engagement

Paris 2024 — JOP

IT Volunteer (Software & Hardware)

Assistance pour le système de résultat sur site (OVRS).