Projet TATIA - Sarcasme détection

Le but du projet est de développer un programme capable de reconnaître une phrase sarcastique.

Dataset

Chaque ligne du fichier contient 3 attributs :

main.py charge le model puis permet de tester si une phrase est sarcastique ou non
Data_pre_treatment.py contient les fonctions permettant de nettoyer les données mais également de transformer les phrases en vecteurs.
model.py contient les fonctions permettant d'entrainer un model sur les données prétraitées puis de sauvegarder ce model et de le recharger.
Word_embedding.py permet d'entrainer un model Word2Vec sur le dataset
pretrained_word_embedding.py permet de charger un dictionnaire de vecteurs précalculé

Lancer le main puis utiliser la fonction mo.is_sarcasm(model, tokenizer, sentence).

mo.is_sarcasm(model, tokenizer, 'Everyone assumes I’m psychopath, except for my friends who live deep inside my head.') test si la phrase est sarcastique ou non
Output : Sarcasm

Name		Name	Last commit message	Last commit date
Latest commit History 66 Commits
Datasets		Datasets
image		image
Data_pre_treatment.py		Data_pre_treatment.py
README.md		README.md
Rapport.md		Rapport.md
Sarcasm_Headlines_Dataset_v2.json		Sarcasm_Headlines_Dataset_v2.json
Word_embedding.py		Word_embedding.py
main.py		main.py
model.h5		model.h5
model.json		model.json
model.py		model.py
pretrained_word_embedding.py		pretrained_word_embedding.py