Want to learn how crazy people use `xan` ? See our curated collection of unhinged `xan` pipelines over there: github.com/medialab/xan...
✨NEW✨: now with parallel cats!
Want to learn how crazy people use `xan` ? See our curated collection of unhinged `xan` pipelines over there: github.com/medialab/xan...
✨NEW✨: now with parallel cats!
📣 Le médialab est à la recherche d'une ou un gestionnaire administratif et financier.
La personne recrutée s'occupera de la gestion financière et administrative du laboratoire et du soutien administratif et logistique auprès de ses membres.
Plus d'infos sur le poste et sur le recrutement ici 🔽
Just published version 0.54.0 of ✨xan✨, @medialab-scpo.bsky.social's CSV magician!
xan now uses our homegrown Rust SIMD CSV parser for up to 8x faster CSV wrangling 🔥.
See the full changelog over there: github.com/medialab/xan...
The parser: docs.rs/simd-csv/lat...
Great news! 🎉 Our Open Research devroom has been accepted for another year at @fosdem.org CfP is now OPEN. Go to our website to see how you can submit a talk on anything research: research-fosdem.github.io
🗓️ Sunday 1st February
📍 Brussels, Belgium
Looking forward to seeing you all at #FOSDEM2026 👩🏽💻
Il y a clairement des recouvrements oui. Les deux outils ne sont pas designés de la même manière ni avec les mêmes affordances ceci dit. Je pense que xan couvre plus de terrain et permet de produire des visualiations. xan est généralement plus rapide que miller, aussi et sait paralléliser autrement.
I don't know TEI very well, but if you know something like `xan from tei` would make sense (it might not be tabular enough for it to mean anythin though), let me know. `xan` has been first and foremost geared towards social sciences and digital humanities after all.
Sorry to eavesdrop here :) but I wonder whether the xan scrape command could take care of a least some subset of this endeavor?
Just released xan v0.53.0 ! A bunch of fixes and new features such as xan map --overwrite and more moonblade functions.
Check out the changelog: github.com/medialab/xan...
📣 Le médialab est à la recherche d'une entreprise prestataire en design et développement de site web dans le cadre de la refonte du design et du front-office d’un annuaire.
Retrouvez le cahier des charges et les informations pour candidater ici 👇
Meme showing Ross Geller from friends pivoting a couch in a staircase.
Releasing xan v0.52.0, with bunch of new features such as pivoting, better transformations, subcommand execution and ranking aggregations. A bunch of bugfixes and QoL improvements are also included as always. Full changelog: github.com/medialab/xan...
Be sure to pivot correctly!
Guillaume Plique (@yomguithereal.bsky.social) will be speaking at #csvconf about "Building CSV-powered tools for social sciences"! Register now: http://csvconfv9.eventbrite.com
Découvrez en rediffusion la conférence "Social Science and Generative AI" organisée par le médialab le 5 juin dernier.
Des intervenants internationaux se sont réunis pour explorer les rôles interconnectés de l'IA générative dans le monde universitaire et la société.
Vidéo disponible ci-dessous 👇
Just released: xan v0.51.0.
Looooots of new features, bugfixes and a novel approach to CSV file single-pass segmentation for map-reduce-like parallel computation over your data!
Check out the changelog over here: github.com/medialab/xan...
Soon: xan sample n -§/--cursed!
What is cursed sampling you may ask? It's when you jump randomly in a CSV file like a dark wizard of course :)
Yup recharts usually does the job™. I think we used it more than once on datascapes.
The emperor
xan hist is one copy paste away
🔧 Découvrez Xan, l'outil ultime pour dompter vos fichiers CSV en ligne de commande ! Optimisez votre temps 🚀 #CSV #Tech #Productivité
xan est un fork de xsv maintenu par des fans de l’outil original, qui corrige pas mal de choses et ajoute des fonctionnalités et un langage d’expression ainsi que pas mal de visualisations directement dans le terminal oui :)
Vue de xan en action
Interface xan
Xan : un outil en CLI Open Source, conçu pour manipuler les CSV développé chez Sciences Po Medialab 🇫🇷
"The CSV magician"
Version actuelle 0.48.0
👉 Le projet : github.com/medialab/xan
👉 Lire l'article "A love letter to the CSV format" : medialab.sciencespo....
Quoting with some image! Alas the fury!
But What if you quote a quote? Does it become a quotequote?
Quoting a test is, in itself, a quote.
New release of xan (v0.48.0) by the research engineering team of the médialab!
Better scraping, smarter CSV commands — and more.
Check it out ⬇️
Matching url prefixes is not a trivial task. 1. you must be able to reorder urls to become meaningful hierarchical sequences 2. you need a prefix tree able to find a longest prefix so that matching remains efficient.
I just published a guide about how xan does it here: github.com/medialab/xan...
Just released v0.48.0 of xan, @medialab-scpo.bsky.social CSV wrangling command!
Highlights include better scrape, network, explode & implode commands, a new url-join command and xan search --url-prefix flag to easily match rows on url prefixes!
github.com/medialab/xan...
Still better than SparQL :)
I found the ultimate CLI tool for processing CSV files! 🔥
🪄✨ xan: The CSV magician.
💯 Supports expressions, parallelism, advanced filtering, sorting, and visualizations.
🦀 Written in Rust & uses @ratatui.rs
⭐ GitHub: github.com/medialab/xan
#rustlang #ratatui #tui #csv #cli #commandline
Et merci à @jwyg.bsky.social qui nous a soumis l'idée d'élargir l'outil à plus de moteurs !
Vivement un workshop avec le @publicdatalab.bsky.social pour bosser tous ensemble avec ! :)
Vous pouvez l'installer et le tester directement en quelques clics depuis la page suivante
medialab.github.io/SearchEngine...
Merci à @jpontoire.bsky.social dont ce fut l'une des nombreuses réalisations au cours de son stage dans l'équipe technique du @medialab-scpo.bsky.social ces 5 derniers mois!
Un aperçu des menus interactifs que l'outil ajoute dans les pages de moteurs de recherche pour permettre d'en télécharger les données.
Besoin de scraper des moteurs de recherche ?
On vient de refondre notre vieil outil GoogleBookmarklets :
SearchEnginesBookmarklets permet désormais de collecter en CSV des résultats Google, DuckDuckGo, Qwant, Baidu, Google & DuckDuckGo Images & Google Scholar ! medialab.sciencespo.fr/actu/collect...