Guillaume Plique's Avatar

Guillaume Plique

@yomguithereal

Research Engineer at SciencesPo's médialab.

87
Followers
130
Following
20
Posts
10.10.2023
Joined
Posts Following

Latest posts by Guillaume Plique @yomguithereal

Post image

Want to learn how crazy people use `xan` ? See our curated collection of unhinged `xan` pipelines over there: github.com/medialab/xan...

✨NEW✨: now with parallel cats!

20.02.2026 16:39 👍 3 🔁 0 💬 0 📌 0
Preview
Recrute gestionnaire administratif et financier en CDI | médialab Sciences Po Le médialab recherche une ou un gestionnaire administratif et financier pour rejoindre son équipe en CDI.

📣 Le médialab est à la recherche d'une ou un gestionnaire administratif et financier.

La personne recrutée s'occupera de la gestion financière et administrative du laboratoire et du soutien administratif et logistique auprès de ses membres.

Plus d'infos sur le poste et sur le recrutement ici 🔽

09.12.2025 09:02 👍 0 🔁 2 💬 0 📌 0
Release v0.54.0 · medialab/xan The SIMD update. Breaking Bumping MSRV to 1.83.0. Dropping xan plot -Y/--add-series. It is now possible to select multiple columns as <y> in xan plot <x> <y> instead. Dropping the -C/--force-colo...

Just published version 0.54.0 of ✨xan✨, @medialab-scpo.bsky.social's CSV magician!

xan now uses our homegrown Rust SIMD CSV parser for up to 8x faster CSV wrangling 🔥.

See the full changelog over there: github.com/medialab/xan...

The parser: docs.rs/simd-csv/lat...

17.11.2025 14:50 👍 3 🔁 0 💬 0 📌 0
Preview
a cartoon character says good news in front of a futurama sign ALT: a cartoon character says good news in front of a futurama sign

Great news! 🎉 Our Open Research devroom has been accepted for another year at @fosdem.org CfP is now OPEN. Go to our website to see how you can submit a talk on anything research: research-fosdem.github.io
🗓️ Sunday 1st February
📍 Brussels, Belgium

Looking forward to seeing you all at #FOSDEM2026 👩🏽‍💻

10.11.2025 19:37 👍 5 🔁 5 💬 0 📌 2

Il y a clairement des recouvrements oui. Les deux outils ne sont pas designés de la même manière ni avec les mêmes affordances ceci dit. Je pense que xan couvre plus de terrain et permet de produire des visualiations. xan est généralement plus rapide que miller, aussi et sait paralléliser autrement.

23.10.2025 19:42 👍 1 🔁 0 💬 0 📌 0

I don't know TEI very well, but if you know something like `xan from tei` would make sense (it might not be tabular enough for it to mean anythin though), let me know. `xan` has been first and foremost geared towards social sciences and digital humanities after all.

21.10.2025 14:28 👍 1 🔁 0 💬 0 📌 0

Sorry to eavesdrop here :) but I wonder whether the xan scrape command could take care of a least some subset of this endeavor?

21.10.2025 12:28 👍 0 🔁 0 💬 1 📌 0
Preview
Release v0.53.0 · medialab/xan Breaking xan partition now normalizes filenames to lowercase to correctly deal with case-insensitive filesystems. xan partition also gets a related -C/--case-sensitive flag. Features Adding all ...

Just released xan v0.53.0 ! A bunch of fixes and new features such as xan map --overwrite and more moonblade functions.

Check out the changelog: github.com/medialab/xan...

19.09.2025 15:42 👍 1 🔁 0 💬 0 📌 0
Preview
Recherche prestataire en design et développement de site web dans le cadre du projet RésIn | médialab Sciences Po Le médialab de Sciences Po recherche une entreprise prestataire dans le cadre du projet RésIn pour une mission de refonte du front-office d’un site web.

📣 Le médialab est à la recherche d'une entreprise prestataire en design et développement de site web dans le cadre de la refonte du design et du front-office d’un annuaire.

Retrouvez le cahier des charges et les informations pour candidater ici 👇

11.09.2025 08:21 👍 0 🔁 1 💬 0 📌 0
Meme showing Ross Geller from friends pivoting a couch in a staircase.

Meme showing Ross Geller from friends pivoting a couch in a staircase.

Releasing xan v0.52.0, with bunch of new features such as pivoting, better transformations, subcommand execution and ranking aggregations. A bunch of bugfixes and QoL improvements are also included as always. Full changelog: github.com/medialab/xan...

Be sure to pivot correctly!

31.07.2025 07:55 👍 2 🔁 0 💬 0 📌 0
Post image

Guillaume Plique (@yomguithereal.bsky.social) will be speaking at #csvconf about "Building CSV-powered tools for social sciences"! Register now: http://csvconfv9.eventbrite.com

28.07.2025 12:45 👍 2 🔁 1 💬 0 📌 0
Preview
Retour sur la conférence « Social Science and Generative AI » | médialab Sciences Po Retrouvez en image la conférence « Social Science and Generative AI: Inquiries, Instruments, Consequences » organisée par le médialab le 5 juin 2025. Des intervenants internationaux ont discuté des qu...

Découvrez en rediffusion la conférence "Social Science and Generative AI" organisée par le médialab le 5 juin dernier.

Des intervenants internationaux se sont réunis pour explorer les rôles interconnectés de l'IA générative dans le monde universitaire et la société.

Vidéo disponible ci-dessous 👇

04.07.2025 11:29 👍 3 🔁 7 💬 0 📌 1
Preview
Release v0.51.0 · medialab/xan The parallel update. Breaking Dropping undocumented xan index and related interactions (in xan count, xan sample, xan slice & xan split --jobs). Dropping now useless coalesce moonblade function. x...

Just released: xan v0.51.0.

Looooots of new features, bugfixes and a novel approach to CSV file single-pass segmentation for map-reduce-like parallel computation over your data!

Check out the changelog over here: github.com/medialab/xan...

30.06.2025 10:55 👍 4 🔁 2 💬 0 📌 0

Soon: xan sample n -§/--cursed!

What is cursed sampling you may ask? It's when you jump randomly in a CSV file like a dark wizard of course :)

15.05.2025 16:44 👍 2 🔁 0 💬 0 📌 0

Yup recharts usually does the job™. I think we used it more than once on datascapes.

09.04.2025 15:57 👍 0 🔁 0 💬 0 📌 0
The emperor

The emperor

xan hist is one copy paste away

08.04.2025 18:23 👍 1 🔁 0 💬 1 📌 0
Preview
Xan - Un outil surpuissant pour manipuler vos fichiers CSV en ligne de commande | Le site de Korben Alors on est en 2025 et y’a encore des gens qui utilisent du CSV comme source de données. Non mais “allo quoi” comme on disait en 2013 ! ...

🔧 Découvrez Xan, l'outil ultime pour dompter vos fichiers CSV en ligne de commande ! Optimisez votre temps 🚀 #CSV #Tech #Productivité

31.03.2025 13:55 👍 10 🔁 4 💬 0 📌 1

xan est un fork de xsv maintenu par des fans de l’outil original, qui corrige pas mal de choses et ajoute des fonctionnalités et un langage d’expression ainsi que pas mal de visualisations directement dans le terminal oui :)

31.03.2025 19:15 👍 2 🔁 0 💬 1 📌 0
Vue de xan en action

Vue de xan en action

Interface xan

Interface xan

Xan : un outil en CLI Open Source, conçu pour manipuler les CSV développé chez Sciences Po Medialab 🇫🇷

"The CSV magician"

Version actuelle 0.48.0

👉 Le projet : github.com/medialab/xan
👉 Lire l'article "A love letter to the CSV format" : medialab.sciencespo....

31.03.2025 16:28 👍 31 🔁 12 💬 3 📌 0

Quoting with some image! Alas the fury!

31.03.2025 11:42 👍 1 🔁 0 💬 0 📌 0

But What if you quote a quote? Does it become a quotequote?

31.03.2025 11:41 👍 1 🔁 0 💬 2 📌 0

Quoting a test is, in itself, a quote.

31.03.2025 11:40 👍 0 🔁 0 💬 0 📌 1

New release of xan (v0.48.0) by the research engineering team of the médialab!

Better scraping, smarter CSV commands — and more.

Check it out ⬇️

28.03.2025 10:03 👍 3 🔁 1 💬 0 📌 0

Matching url prefixes is not a trivial task. 1. you must be able to reorder urls to become meaningful hierarchical sequences 2. you need a prefix tree able to find a longest prefix so that matching remains efficient.

I just published a guide about how xan does it here: github.com/medialab/xan...

26.03.2025 16:23 👍 0 🔁 0 💬 0 📌 0
Preview
GitHub - medialab/xan: The CSV magician The CSV magician. Contribute to medialab/xan development by creating an account on GitHub.

Just released v0.48.0 of xan, @medialab-scpo.bsky.social CSV wrangling command!

Highlights include better scrape, network, explode & implode commands, a new url-join command and xan search --url-prefix flag to easily match rows on url prefixes!

github.com/medialab/xan...

26.03.2025 10:53 👍 4 🔁 2 💬 0 📌 1

Still better than SparQL :)

26.03.2025 07:52 👍 1 🔁 0 💬 0 📌 0
Video thumbnail

I found the ultimate CLI tool for processing CSV files! 🔥

🪄✨ xan: The CSV magician.

💯 Supports expressions, parallelism, advanced filtering, sorting, and visualizations.

🦀 Written in Rust & uses @ratatui.rs

⭐ GitHub: github.com/medialab/xan

#rustlang #ratatui #tui #csv #cli #commandline

13.02.2025 11:45 👍 21 🔁 5 💬 0 📌 0

Et merci à @jwyg.bsky.social qui nous a soumis l'idée d'élargir l'outil à plus de moteurs !

Vivement un workshop avec le @publicdatalab.bsky.social pour bosser tous ensemble avec ! :)

13.02.2025 10:08 👍 2 🔁 1 💬 1 📌 0
Search Engines Bookmarklet

Vous pouvez l'installer et le tester directement en quelques clics depuis la page suivante
medialab.github.io/SearchEngine...

Merci à @jpontoire.bsky.social dont ce fut l'une des nombreuses réalisations au cours de son stage dans l'équipe technique du @medialab-scpo.bsky.social ces 5 derniers mois!

13.02.2025 10:08 👍 3 🔁 2 💬 1 📌 0
Un aperçu des menus interactifs que l'outil ajoute dans les pages de moteurs de recherche pour permettre d'en télécharger les données.

Un aperçu des menus interactifs que l'outil ajoute dans les pages de moteurs de recherche pour permettre d'en télécharger les données.

Besoin de scraper des moteurs de recherche ?
On vient de refondre notre vieil outil GoogleBookmarklets :
SearchEnginesBookmarklets permet désormais de collecter en CSV des résultats Google, DuckDuckGo, Qwant, Baidu, Google & DuckDuckGo Images & Google Scholar ! medialab.sciencespo.fr/actu/collect...

13.02.2025 10:08 👍 18 🔁 9 💬 1 📌 2