Tous les Projets
NLP

Systèmes de Recommandation de Livres — Taxonomie Complète

Taxonomie complète des systèmes de recommandation sur BookCrossing (1,1M d'évaluations) : User-CF, Item-CF, SVD/NMF/ALS, basé contenu, hybride, NCF, AutoRec, GRU4Rec. User-CF RMSE 1,6645, P@10 0,6629, R@10 0,6910.

1.6645
User-CF RMSE
0.6629
Precision@10
0.6910
Recall@10
8 (CF → DL)
Architectures
Jeu de Données

BookCrossing : 1 149 780 évaluations, 271 360 livres, 278 858 utilisateurs

Approche

Taxonomie complète : User-CF → Item-CF → MF → Basé contenu → Hybride → NCF/AutoRec/GRU4Rec

Stack Technique
PythonPyTorchSurprise (SVD/NMF)Scipy (ALS)scikit-learn
Mots-clés
Collaborative FilteringSVDNCFGRU4RecMatrix FactorizationRecommender Systems
Visualisations2 Graphiques
Analyse Approfondie

Implémentation complète de tous les grands paradigmes de systèmes de recommandation sur le dataset Book-Crossing.

Jeu de données

  • Brut : 271 360 livres, 278 858 utilisateurs, 1 149 780 évaluations
  • Filtré (explicite ≥ 1) : 118 699 évaluations, 7 027 utilisateurs, 9 438 livres
  • Échelle d'évaluation : 1–10 (explicite) + feedback implicite (vues de pages)

Taxonomie Complète

Systèmes de Recommandation
├── 1. Filtrage Collaboratif
│   ├── CF basé utilisateur (similarité cosinus, K=20)
│   ├── CF basé items
│   └── Factorisation matricielle : SVD / NMF / ALS
├── 2. Filtrage Basé Contenu
│   └── TF-IDF sur métadonnées livre (titre, auteur, genre)
├── 3. Hybride
│   ├── Combinaison pondérée (CF + CB)
│   └── Commutation (CB pour utilisateurs cold-start)
└── 4. Deep Learning
    ├── NCF (Filtrage Collaboratif Neuronal)
    ├── AutoRec (CF Autoencoder)
    └── GRU4Rec (séquentiel basé session)

Résultats Clés (User-CF)

MétriqueValeur
RMSE1,6645
Precision@100,6629
Recall@100,6910

Gestion du Démarrage à Froid Les nouveaux utilisateurs (<5 évaluations) basculent vers les recommandations basées contenu ou sur la popularité. La stratégie de commutation hybride évite l'échec du CF sur le cold-start.

Insight Clé GRU4Rec (basé session) est l'architecture la plus utile en pratique — il gère les utilisateurs anonymes et capture l'intention à court terme sans nécessiter d'historique, ce qui est la réalité pour la plupart des sessions e-commerce.