SMS-spam-filter

Projekt realizuje filtr SPAM wiadomości SMS w pythonie przy wykorzystaniu Naive Bayes. Baza wiadomości SMS wykorzystana przy realizacji: https://www.kaggle.com/uciml/sms-spam-collection-dataset.

Projekt implementuje 2 moduły wyliczania prawdopodobieństw:

Na preprocessing zaawansowany składają się:

zamiana wszystkich liter na małe (wybierane za pomocą wartości TRUE flagi --lower)
usunięcie wyrazów kluczowych języka angielskiego, takich jak "the" (wybierane za pomocą wartości TRUE flagi --rmStop)
redukcja wyrazów do ich trzonów, bez końcówek fleksyjnych: "goes -> "go" (wybierane za pomocą wartości TRUE flagi --stem)

Moduł testujący skuteczność uczenia dokonuje tego poprzez wyliczenie 4 wartości:

Projekt wymaga zainstalowanych: -numpy -pandas -nltk

Autorzy:

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
.idea		.idea
.gitignore		.gitignore
README.md		README.md
spam.csv		spam.csv
spamFilter.py		spamFilter.py
test.txt		test.txt

Provide feedback