Projet Application de recommandation de films

Dans le cadre de ce nouveau projet, nous avons créé notre cabinet de consulting Data avec moi-même et trois autres membres. 

Nous avons été démarché par un cinéma dans la région de la Creuse qui souhaitait créer une application de recommandation de films pour ses clients. 

La première étape a été de faire une étude de marché sur la région creusoise, identifier la cible de cette application et apprendre à mieux connaître les habitants de la Creuse. Ensuite nous avons déterminer une thématique de film pour le système de recommandation.

Il a fallu récupérer des données d'abord via iMDb puis via des requêtes API sur TMDB. Cela nous a permis d'avoir une base de données enrichie. 

L'étape qui a suivit était très intéressante, nous avons commencé a utiliser le Machine Learning pour créer notre système de recommandation. Après beaucoup de nettoyage de données et quelques bugs nous avons réussi à avoir quelque chose de pertinent, de cohérent et d'exploitable.

Pour finir, après une collaboration en groupe sur Github, nous avons déployer l'application "CinéMatch" via streamlit qui est accessible ci dessous :

Etude de marché sur la Creuse

Dans ce projet 2, nous avons travailler en méthode Agile. Nous avons donc opérer avec un Product Owner, un Scrum Master et un Code Review. 

Exploration et Analyse des données  

Pour commencer, il a d'abord fallu récupérer les bases de données mise a disposition par iMDb pour les nettoyer. Nous avons cherché si il y avait des doublons, des valeurs manquantes. Nous avons supprimé les films qui n'étaient pas dans notre thématique et fait en sorte de garder une base de données de films américains type "blockbuster" et de film d'animation des années 1990 à aujourd'hui. Nous avons ensuite fait des requêtes API sur TMDB pour alimenter notre base de donnée initiale.

Ce fut un travail d'orfèvre, certaines bases de données contenait des millions de lignes ! Il a fallu trouver les bons moyens pour les lire, les exploiter et petit à petit en réduisant leur taille les données devenaient de plus en plus exploitables.

Chaque membre de l'équipe a travaillé sur sa partie. Il y avait la base de données des films, celle des acteurs, celle sur les notes et les votes des films, les genres, les dates de sortie, etc. Une fois ce travail effectué, il était temps de tout mettre en commun : une base de données sur les films, une sur les intervenant et une autre avec les identifiants des films et des acteurs pour pouvoir faire le lien entre les deux.

Diagram showing IMDb and TMDB dataset cleaning and importation into Power BI for data analysis.
Diagram showing IMDb and TMDB dataset cleaning and importation into Power BI for data analysis.
Power Point et Power Bi

Par la suite, nous avons commencé a organiser notre Power Point pour présenter notre projet, l'entreprise que nous sommes ainsi que le client. Pour chaque partie clé de notre analyse, nous avons effectué une introduction pour expliquer où est-ce que nous voulons aller.

Puis, nous nous sommes appuyés sur Power Bi pour commencer l'élaboration de notre dashboard dynamique. Nous avons utilisé le langage Dax pour affiner nos graphiques et leur donner un côté beaucoup plus visuel et parlant.

Au fil des briefings entre toute l'équipe, nous avons choisi une charte graphique sobre, efficace et des KPI pertinents pour notre client.

Le travail de groupe a été très intéressant et nous à pousser à aller encore plus loin. Le partage d'idée et les conseils des uns et des autres fut un élément clé dans la réussite de notre projet. Notre organisation s'est révélée efficace au fur et à mesure des semaines pour un rendu final proche de ce que nous avions planifié.

Nous avons présenté notre projet à l'oral devant un auditoire d'une trentaine de personnes qui a pu partager son ressenti sur notre travail.

Galerie photos

Quelques clichés pris lors de la réalisation de ce projet

Contact

Pour toute question, n'hésitez pas à me joindre.

Email cedric.bedu@gmail.com

Téléphone 06 27 03 05 46

© 2025. All rights reserved.