Biographie

Je suis chercheur en humanités numériques. Je me suis plus particulièrement spécialisé dans l'analyse textuelle automatisée (ou text mining) de documents patrimoniaux numérisés.

J’ai soutenu ma thèse en Sciences de l'information et de la communication à Paris-IV (CELSA), sous la direction d’Adeline Wrona. Elle a été distinguée par le Prix Jeune chercheur 2016 de la SFSIC.

Je suis engagé depuis janvier 2018 comme post-doc pour le projet ANR Numapresse. Je développe des outils et de nouvelles méthodes de lectures distantes pour de grands corpus d'archive de presse. J'ai notamment mis en œuvre la classification automatisée des genres journalistiques de l'ensemble numéros parus du Matin et du Petit Parisien entre 1900 et 1945. L'outil créé pour cette tâche TidySupervise est devenu une extension documentée pour le langage de programmation R.

Je contribue à Wikipédia depuis 2006 et suis admnistrateur de la Wikipédia francophone depui 2012. J'ai couvert pendant plusieurs années l'actualité des projets de libre diffusion des connaissances sur mon blog Hotel Wikipédia, hébergé sur Rue89.