NLP

Systèmes de Recommandation de Livres — Taxonomie Complète

Taxonomie complète des systèmes de recommandation sur BookCrossing (1,1M d'évaluations) : User-CF, Item-CF, SVD/NMF/ALS, basé contenu, hybride, NCF, AutoRec, GRU4Rec. User-CF RMSE 1,6645, P@10 0,6629, R@10 0,6910.

Voir sur Kaggle

1.6645

User-CF RMSE

0.6629

Precision@10

0.6910

Recall@10

8 (CF → DL)

Architectures

Jeu de Données

BookCrossing : 1 149 780 évaluations, 271 360 livres, 278 858 utilisateurs

Approche

Taxonomie complète : User-CF → Item-CF → MF → Basé contenu → Hybride → NCF/AutoRec/GRU4Rec

Stack Technique

PythonPyTorchSurprise (SVD/NMF)Scipy (ALS)scikit-learn

Mots-clés

Collaborative FilteringSVDNCFGRU4RecMatrix FactorizationRecommender Systems

Visualisations2 Graphiques

Analyse Approfondie

Implémentation complète de tous les grands paradigmes de systèmes de recommandation sur le dataset Book-Crossing.

Jeu de données

▸Brut : 271 360 livres, 278 858 utilisateurs, 1 149 780 évaluations
▸Filtré (explicite ≥ 1) : 118 699 évaluations, 7 027 utilisateurs, 9 438 livres
▸Échelle d'évaluation : 1–10 (explicite) + feedback implicite (vues de pages)

Taxonomie Complète

Systèmes de Recommandation
├── 1. Filtrage Collaboratif
│   ├── CF basé utilisateur (similarité cosinus, K=20)
│   ├── CF basé items
│   └── Factorisation matricielle : SVD / NMF / ALS
├── 2. Filtrage Basé Contenu
│   └── TF-IDF sur métadonnées livre (titre, auteur, genre)
├── 3. Hybride
│   ├── Combinaison pondérée (CF + CB)
│   └── Commutation (CB pour utilisateurs cold-start)
└── 4. Deep Learning
    ├── NCF (Filtrage Collaboratif Neuronal)
    ├── AutoRec (CF Autoencoder)
    └── GRU4Rec (séquentiel basé session)

Résultats Clés (User-CF)

Métrique	Valeur
RMSE	1,6645
Precision@10	0,6629
Recall@10	0,6910

Gestion du Démarrage à Froid Les nouveaux utilisateurs (<5 évaluations) basculent vers les recommandations basées contenu ou sur la popularité. La stratégie de commutation hybride évite l'échec du CF sur le cold-start.

Insight Clé GRU4Rec (basé session) est l'architecture la plus utile en pratique — il gère les utilisateurs anonymes et capture l'intention à court terme sans nécessiter d'historique, ce qui est la réalité pour la plupart des sessions e-commerce.

Retour aux Projets Me Recruter