Skip to content

Ce dépôt contient l'ensemble de mes projets de Datascience

Notifications You must be signed in to change notification settings

jdjebi/Datascience

Repository files navigation

Data Scientist Junior en MSc Big Data à l'ESTIA

Ce dépôt GitHub contient des projets de Data Science sur lesquels j'ai travaillé au cours de mon parcours professionnel et académique. Les projets sont organisés par type et sont décrits brièvement ci-dessous.

Voici une liste de mes projets, classés par type :

Projet Type Outils Meilleur modèle Précision
Analyse et classification de critiques de films NLP Scikit-Learn, NLTK, Gensim, Spacy Regression logistique 89%
Détection de médicaments défectueux Deep Learning TensorFlow, PyTorch CNN avec TensorFlow 92%
Analyse de la clientèle d'un concessionnaire et recommandation de véhicules Machine Learning Scikit-Learn, Hadoop/Spark, MongoDB, Oracle, HDFS, Mlflow, Docker, Flask Clustering : KMeans, Recommandation : RandomForest Clustering : 72%, Recommandation : 74%
Prédiction de l'affluence sur des lignes de bus Machine Learning/ Deep Learning Scikit-Learn, Keras RandomForestRegressor 50%
Prédiction des salaires à partir des descriptions de postes NLP Scikit-Learn Ridge 81%

Chaque projet comprend un résumé, des détails sur les outils utilisés et un lien vers le code sur Github. N'hésitez pas à y jeter un coup d'œil !

Projet de NLP

Analyse et classification de critiques de films, NLP

ESTIA, Bidart

Prédiction des salaires à partir des descriptions de postes

Projet de Deep Learning

Détection de médicaments défectueux, Deep Learning

AI4Industry, Proditec

Projets de Machine Learning

Analyse de la clientèle d'un concessionnaire et recommandation de véhicules, Machine Learning

  • Construction d'un Datalake pour l'analyse de la clientèle
  • Nettoyage et transformation des données du Datalake
  • Exploration et visualisation des données des clients et du catalogue de véhicules
  • Entraînement d'un modèle de clustering des véhicules, précision 72%
  • Entraînement d'un modèle de recommandation, précision de 74%
  • Déploiement du meilleur modèle sous forme d'API Outils: Scikit-Learn, Hadoop/Spark, MongoDB, Oracle, HDFS, Mlflow, Docker, Flask Source: https://github.com/jdjebi/Datascience/tree/main/Recommandation-Machine-Learning

N'hésitez pas à me contacter si vous avez des questions ou des commentaires sur l'un de ces projets.

Détection de médicaments défectueux, Deep Learning

About

Ce dépôt contient l'ensemble de mes projets de Datascience

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published