neural network

Luis Ventura

Full Stack Data Scientist

Expert en traitement de données et Intelligence Artificielle.
Formation
Master 2 SISE
Statistique et Informatique pour la Science des donnéEs
2019
Classes Préparatoires
aux Grandes Ecoles - PSI
Montpellier
2015
Langues
Français
100%
Espagnol
95%
Anglais
90%
Compétences
Nuage de mot avec mes compétences
Intérêts
Théâtre, Jeux de stratégie, Jeux de société,
Littérature fantasy.
Expériences
Full Stack Data Scientist
  • Mise en place de bonnes pratiques dans la gestion et l'analyse des données ;
  • Création et déploiement de méthodes de détection de fraude ;
  • Analyse des données du covoiturage dans le but d'évaluer l'efficacité des politiques publiques.
Outils principaux : Python, Scikit-Learn, dbt, Elementary, PostGIS, Plotly.
2024
Full Stack Data Scientist
Chez Trackdéchets, j'ai été moteur sur tous les sujets liés à la données :
  • Accompagnement d'un intrapreneur dans le pilotage de projet par la donnée ;
  • Création d'un entrepôt de données ;
  • Mise en place de méthodes de détection de fraude ;
  • Création d'une plateforme données permettant l'orchestration des pipelines de données, la transformation des données, la mise en place de tests et d'outils d'observabilité de la donnée ;
  • Mise en place de nombreux tableaux de bords nécessaires au pilotage de l'activité ;
  • Coopération statistiques avec différentes administrations : ADEME, DREAL, DGPR... ;
  • Création d'une application de visualisation de données présentant des statistiques publiques ;
  • Création d'une application de statistiques à destination des agents de contrôle de l'environnement ;
  • Gestion des sujets open-data.
Outils principaux : Python, Scikit-Learn, Airflow, Meltano, dbt, ClickHouse, Metabase, Django, Plotly.
2022
Full Stack Data Scientist
- 2.5 ans -
  • Algorithmes de machine learning supervisés et non supervisés (détection de fraude, clustering, classification automatique...) sur des données de tous types : texte, audio, image...;
  • Prévision de séries temporelles 📈;
  • Natural language processing (BERT <3) 📝 sur des sujets de NER, NLI, Sentiment Analysis, Matching ;
  • Déploiement d'applications de dataviz ;
  • Déploiement et exposition de modèles ML en mode serverless ;
  • 🔎 Analyses de données massives dans le Cloud ;
  • Conception et orchestration de pipeline de données ;
  • Déploiement d'application de visualisation de données' ;
  • Déploiement de tableaux de bord 📊.
2022
Data Scientist
- 1.5 an -
  • Répondre aux besoins data internes en terme d'analyse et de modèles prédictifs pour, entre autre, développer de nouvelles fonctionnalités produits, détecter la fraude et anticiper le churn ;
  • Développement de modèles de traitement des emails sur la base de traitement du language naturel et traitement de l'image ;
  • Analyses de données massives (volumétrie de l'ordre de 10^9 enregistrements), entraînement et déploiement de modèles de machine learning dans le Cloud Google. Création de dashboards temps réel.
Outils principaux : Python, Scikit Learn, Pytorch, Google Cloud Platform (Vertex AI, Functions, Kubernetes, BigQuery, Data Studio, Logging...), MongoDB, Dataiku DSS, Flask, FastAPI, Tableau.
2020
Ingénieur Machine Learning
- 1.5 an -
  • Développement de fonctionnalités intelligentes s’appuyant sur les technologies Deep Learning.
  • Participation aux projets machine learning de la R&D à la mise en production.
  • Travail en mode «MLOps» avec le cloud Azure pour la mise en service d’algorithmes d’IA.
Outils principaux : Python, PyTorch, Scikit Learn, TensorFlow, Keras, Pandas, Plotly, Azure.
2019
Ingénieur IHM & Mission Controller
Réalisation d’une application web de contrôle de mission en temps réel de ballons stratosphériques.
Outils principaux : PHP, JavaScript, HTML5 & CSS3, Java pour Android, Python.
2018