Skip to content

© Madalin Ionescu, Printemps de Sciences 2019

Notifications You must be signed in to change notification settings

sirbuadriana/TrashRec

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 
 
 
 
 

Repository files navigation

Abstract

Introduction

Problématique - dans la vie quotidienne

Graphique cantité de déchets Chaque année, les États-Unis produisent plus de 250 millions de tonnes de déchets ménagers. Environ un tiers est recyclé ou composté, le reste étant soit incinéré, soit enterré dans des terrains de décharge. Des études montrent que nous pourrions réutiliser plus de 70% des déchets enfouis dans la terre, notamment des matériaux tels que le verre, le métal ou le papier. En recyclant les déchets métalliques par exemple, nous consommons jusqu'à 95% moins d'énergie que de les extraire et de les transformer depuis leur forme naturelle. Même si en Europe les choses semblent un peu meilleures, car le pourcentage de déchets ménagers recyclés ou compostés est d’environ 46% (ou de 54% en Belgique), cela ne représente que la moitié de la quantité produite [2]. Contrairement à cela, de nombreux pays en développement n’ont pas de système de recyclage mis en place et même certains qui ont un indice de développement humain élevé déclarent avoir un pourcentage de déchets ménagers recyclés proche de zéro. (1% en Turquie et au Chili) [3, 4]. Ces pourcentages moyens qui sont relativement faibles, comparés au taux de recyclage cible de 75%, empêchent à l'objectif actuel de l'humanité d’avoir un développement durable , en réduisant les réserves naturelles de certaines ressources, telles que les métaux, ou en créant d'énormes décharges générant des quantités considérables des gaz à effet de serre et autres.

Le facteur humain

Une méthode possible pour augmenter la quantité de déchets recyclés ou compostés est de créer un meilleur système de recyclage, car même dans les pays où un système de collecte sélective de déchets est mis en place, il est sujet aux erreurs humaines. La contamination des lots collectés par d'autres matériaux et substances à cause d'erreurs humaines dans la classification des matériaux pourrait avoir un impact important sur la quantité totale de matériaux recyclés et sur la qualité du produit secondaire [4]. Types de platique Même si aucun rapport officiel à grande échelle présentant la quantité de déchets classés par erreur ne puisse être trouvé, différentes sources non officielles s'accordent sur un pourcentage des déchets plastiques totale mal classées compris entre 20 et 40% selon les pays européens, et ce nombre peut aller au-dessus de 60% en Australie. Globalement, à peu près 70% de déchets se retrouvent dans la bonne catégorie de recyclage, selon les mêmes sources non officielles. Ceci motive l’idée de créer un système de tri automatique des déchets, qui trie les déchets à la source afin d’éviter le problème de contamination.

Méthodologie

Computer vision - vision par l'ordinateur

Diagramme displicines Le domaine d'étude des éléments d'une image à l'aide d'un ordinateur s'appelle la vision par ordinateur et se situe au croisement de multiples disciplines différentes: physique (pour l'optique et la formation d'images), biologie et psychologie (comprendre comment le cerveau traite l'information visuelle), informatique , mathématiques et ingénierie. Il est apparu pour la première fois dans les années 1960 [5], puis l’idée des réseaux de neurones convolutionnels a été développée quelques décennies plus tard [6]. Graphique evolution puissance de calcul En raison de leur forte demande en puissance de calcul, la popularité des CNN n'a augmenté de manière substantielle qu'à la fin du troisième millénaire, lorsque le développement des GPU (processeurs graphiques) a réduit le temps de calcul de ces algorithmes grâce à la programmation parallèle et à un grand nombre de noyaux. C’est aussi le moment où de grands ensembles de données étiquetées sont disponibles sur (et grâce à l') Internet. Environ une décennie plus tard, en 2012, le taux d'erreur des réseaux de neurones convolutionnels a diminué (leur précision a monté en flèche) grâce au développement de l'architecture AlexNet.

Les réseaux de neurones

En commençant par ce qui est un réseau neuronal artificiel, nous pouvons l'expliquer comme suit: un réseau neuronal artificiel est un agrégat de plusieurs algorithmes d'apprentissage automatique travaillant en tandem pour traiter des entrées de données complexes, dans notre cas, des images. Réseaux de neurones artificiels Plus généralement, un réseau de neurones est un modèle du cerveau humain extrêmement simplifié, composé de neurones artificiels, généralement structurés en plusieurs couches, et d'un ensemble de fonctions reliant ces neurones, l'analogie de la synapsis. La force de ce système est qu’il n’est pas nécessaire de programmer des règles spécifiques aux tâches, car le système apprend par lui-même en analysant des exemples déjà connus. Mais c'est la définition d'un réseau de neurones normal. Le mot convolutif, en informatique, désigne une sorte de fonction qui mappe un tuple de séquences dans une séquence de tuples. Dans ce cas, la différence fondamentale entre un tuple et une collection est que le premier tient compte de l’ordre, tandis que la dernière ne le fait pas. Réseaux de neurones convolutifs En réunissant les choses, nous pouvons dire qu'un réseau de neurones convolutifs fonctionne en recherchant des modèles dans une image.

Le jeu de données

La collection d'images, le jeu de données que nous avons utilisé pour ce projet est identique à celui du projet Classification of Trash for Recyclability Status et est composée de 2527 images, classées en 6 classes, correspondant aux six catégories de poubelle aux États-Unis: carton, papier, verre, métal, plastique et déchets. Catégories de déchets Pour utiliser le même ensemble de données en Belgique, les classes carton et papier et plastique et métal doivent être fusionnées dans deux autres classes, mais cela peut se faire facilement au moment de la prédiction. De plus, afin d’accélérer le temps de traitement et d’éliminer les différences de résolution entre les images, puisqu’une partie a été prise avec un appareil photo de 8 mp et une partie avec un appareil photo de 12 mp, nous avons réduit leur taille, pour que le plus long bord ait 1024 pixels (réduisant ainsi l’entrée du réseau environ 16 fois). Cette valeur est considérablement plus grande que la résolution 299 x 299 utilisée par Inception et 224 x 224 utilisée par VGG, mais nous a permis de tester différents modèles et de jouer avec des techniques d'accroissement de données telles que le zoom et la rotation, sans perte de qualité de l'image.

Augumentation de données

Étant donné que notre ensemble de données contenait un petit nombre d'images, au moins en comparaison avec l'ensemble de données ImageNet, qui était utilisé initialement pour entrainer les modèles et qui compte actuellement plus de 14 millions d'images, nous avons utilisé quelques techniques d'accroissement de données pour l'augmenter artificiellement. Pour le modèle Inception, nous avons utilisé les transformations: cisaillement, zoom, retournement horizontal, rotation, décalage en largeur et en décalage en hauteur. Augumentation de données

About

© Madalin Ionescu, Printemps de Sciences 2019

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published