Comment Vigie Citoyenne collecte, analyse et visualise le contenu médiatique.
Vigie Citoyenne ingère automatiquement les flux RSS de 10 sources médiatiques françaises : CNews, Europe 1, Le JDD, Valeurs Actuelles, France Info, BFMTV, TF1 Info, Mediapart, Frontières et France 2.
Les articles sont collectés en temps réel via un ingestor cloud. Seuls les métadonnées publiquement disponibles dans les flux RSS sont indexées : titre, description, auteur, date de publication et lien.
Chaque article est analysé par un modèle de langage local (Mistral-Nemo via Ollama) qui extrait trois types d'informations :
Thèmes dominants — 1 à 3 thématiques macro-politiques parmi une liste de 22 catégories (Économie, Immigration, Sécurité, Justice, etc.). L'IA ne sélectionne un thème que s'il est au cœur du texte.
Entités nommées — Personnalités publiques (format Prénom Nom) et organisations (acronymes officiels) qui ont un poids politique, économique ou médiatique.
Marqueurs lexicaux — 5 à 12 mots ou expressions portant une charge idéologique ou émotionnelle. Le modèle est guidé pour identifier les "dog whistles" et le vocabulaire de cadrage éditorial, en rejetant les termes neutres factuels.
Les données extraites alimentent quatre types de visualisations :
Matrice de l'Agenda — Heatmap montrant quels médias couvrent quels thèmes et dans quelles proportions.
Radar Lexical — Les marqueurs lexicaux les plus fréquents par source, permettant de détecter les vocabulaires orientés.
Personnalités citées — Classement des figures publiques par nombre d'occurrences et par média.
Comparateur — Analyse côte-à-côte du lexique employé par deux médias différents sur un même thème.
Vigie Citoyenne ne juge pas — elle expose. L'objectif n'est pas de qualifier un média de "bon" ou "mauvais", mais de fournir des données objectives pour que chacun puisse former son propre jugement.
Limites connues : L'analyse IA peut produire des erreurs d'extraction. La liste de 22 thèmes est volontairement large et peut sembler simpliste pour des sujets complexes. Le corpus est limité aux sources configurées et aux articles disponibles dans les flux RSS publics.
Open source : Le code source est intégralement disponible sur GitHub. La méthodologie et les prompts IA sont publics et auditables.
Des questions sur la méthodologie ? Contactez-nous ou consultez le code source.