Scraping : Wikipédia et Wikidata via des scripts Python, appels API et requêtes SparQL.
Labelling : Apertus AI pour la classification des condamnations.
Scraping : Wikipédia et Wikidata via des scripts Python, appels API et requêtes SparQL.
Labelling : Apertus AI pour la classification des condamnations.
Capture d'écran concernant Brigitte Barèges (UDR) pour une affaire de 2025 "Annulation de son élection législative 2024" avec pour description : "Le Conseil constitutionnel annule son élection et la déclare inéligible pour un an, entraînant sa démission d'office de son mandat de députée".
Par ailleurs, la seule affaire initialement retenue concernait l'annulation d'une élection par le Conseil constitutionnel (pas une condamnation pénale). Elle a depuis été retirée du jeu de données.
"Brigitte Barèges [...] L'élue Les Républicains a été relaxée ce mardi 14 décembre par la cour d'appel de Toulouse." www.francebleu.fr/infos/faits-...
bsky.app/profile/john...
bsky.app/profile/john...
Et difficile de prendre au sérieux l’aspect "contributif" sans jeu de données téléchargeable, alors même que le projet se vend comme une base de données. On a vu plus contributif comme démarche. (Et publier le code source ne remplace pas l’Open Data).
Quand les fondations sont aussi fragiles, ce n'est pas une "amélioration" qu'il faut, c'est une refonte. Je ne suis pas au service du projet individuel d'un ingénieur de recherche qui s'affranchit des standards méthodologiques de base.
Je ne dis pas qu'on ne peut pas représenter les condamnations de personnalités politiques par parti politique et par date, mais cette exécution-là est une mauvaise façon de faire : c'est une mauvaise visualisation et les données sont douteuses.
Pour un ingénieur de recherche, la rigueur n'est pas une option qu'on ajuste selon les retours. On ne balance pas une ébauche en invoquant la démarche itérative comme absolution face aux critiques. À son niveau d'expertise c'est un renoncement : la fiabilité des données n'est pas une option.
D'accord.
Un cercle n'est pas un élu : c'est une condamnation pénale* d'une personnalité politique (maire, député, ministre, candidat, etc.), qu'elle soit en exercice, retirée de la vie publique ou décédée.
* Il ne s'agit même pas à strictement parler de condamnation pénale mais c'était le projet initial.
Sauf que si le « merle » est empoisonné, on s'intoxique. Valider une visualisation trompeuse et une méthode fragile au nom de la "contre-propagande", c'est se décrédibiliser. Ne vous sentez pas obligé de répondre, j'ai le blocage facile.
Je suis formé en analyse quantitative des données sociales : si j'ai écrit ce fil, c'est précisément parce que "je me projette" et que j'en vois les limites. Par ailleurs, l'initiative n'est pas nouvelle (poligraph.fr/statistiques) et les choix de visualisation y sont moins confus.
On ne combat pas la propagande des médias dominants avec une data-viz sans aucune légende, trompeuse, qui agglomère des données hétérogènes et non vérifiées.
L'initiative n'est pas nouvelle : poligraph.fr/statistiques propose déjà ce travail. Je n'ai pas encore analysé leur méthodologie (poligraph.fr/sources), mais sur la forme, les choix de visualisation évitent au moins le piège du sensationnalisme pour privilégier la clarté.
Une décision du conseil constitutionnel n'est pas une condamnation.
L'argument selon lequel ce graphique resterait représentatif d'une réalité malgré ses imprécisions est trompeur, car le biais n'est pas seulement dans la donnée, il est aussi dans les choix de visualisation des données (biais de conception) qui baisent la perception des faits.
Difficile d’y voir une excellente idée de visualisation quand la forme est trompeuse, la lisibilité confuse et le fond erroné. C’est, en somme, une agrégation incohérente de données hétérogènes au service d’une mauvaise manière de représenter des données peu fiables.
Bref, c'est un outil conçu pour être visuellement frappant et fait pour être partagé sur les réseaux sociaux. L'auteur reconnaît d'ailleurs une représentation « un peu putaclic ». Mais sa fragilité méthodologique le disqualifient, à mes yeux, en tant que support d'information fiable.
Le projet s'appuie sur du scraping Wikidata/Wikipedia (expose à plusieurs biais liés à l'indexation) et une catégorisation par IA (Apertus Instruct) avec peu de vérification humaine.
Les filtres interactifs (dates, partis, infractions) présentent des dysfonctionnements techniques (en tout cas chez moi).
Le graphique tente de placer les condamnations sur un axe temporel, mais comme les bulles s'empilent pour ne pas se chevaucher, la position n'a plus de valeur.
Cette tentative de créer un indice de gravité de la peine échoue par la mise en équivalence de variables incommensurables au sein d'une seule unité visuelle.
La taille des cercles varie selon la durée de la peine (prison ou inéligibilité) ou le montant de l’amende, mais ce n'est indiqué nulle part en l'absence de légende.
De plus, la présence de Brigitte Barèges, qui a bien été députée mais n'a pas été condamnée, questionne la fiabilité du traitement des données. Et la présence de doublons (3 mentions de Laurence Arribagé pour la même condamnation) confirme un nettoyage des données peu investi.
La présence d'Éric Zemmour, qui n'a jamais été élu, interroge. Sur le site, le titre à d'ailleurs changé en cours de route pour « personnalités politiques condamnées, par parti »). Ce qui confirme que le périmètre de l’étude n’était pas rigoureusement délimité.
En fait, un cercle correspond à une condamnation d'une personnalité politique qui a été élue (maire, député, etc.) à un moment de sa vie. Une même personne peut donc être représentée plusieurs fois. Il faudrait clarifier que l’unité de mesure est la condamnation et non la personne.
Il s'agit d'une data-visualisation sous forme d'hémicycle parlementaire, avec pour titre : « élu·e·s condamné·e·s au pénal par parti politique ». Ce qui est trompeur. En reprenant la forme d'une assemblée, le graphique suggère là aussi qu'un cercle correspond à un élu parlementaire condamné.
Le graphique (du site « casier-politique.fr ») prend la forme d'un hémicycle parlementaire composé de bulles colorées de tailles variables. Initialement titré « Élu·e·s condamné·e·s au pénal par parti politique », le titre a évolué vers « Personnalités politiques condamnées, par parti ». Un axe temporel horizontal (1985-2026) tente de structurer la base, mais les bulles s'empilent verticalement pour éviter les chevauchements, rendant la position temporelle imprécise et peu lisible. Il n'y a pas de légende.
Cas d’école de projet de data-visualisation sacrifiant la rigueur méthodologique sur l’autel d'une esthétique clickbait.
En forçant l'écriture dans des dossiers build, j'ai cassé le mécanisme des \subfiles 😭