Numapresse

Pour une approche critique du Text Mining

Nous présentons la méthodologie du projet Numapresse qui s’appuie sur la collecte de données textuelles « enrichies » pour reconstituer des dispositifs éditoriaux de la presse ancienne…

Sciences communes

Classer l'écrit : les données du catalogue de la BNF

Cette recherche s'appuie sur la totalité du catalogue de la BNF pendant tout le XIXe siècle, de 1800 à 1900 soit 3 419 594 « objets » correspondants à 568 550 identifiants.

Numapresse

TidySupervise

Une extension documentée pour R permettant de créer des classifications automatisées

Numapresse

Fictions policières : des collections éditoriales au genre

Présentation avec Matthieu Letourneux d'un essai de classification automatisée de 3000 romans policiers à partir des collections éditoriales pour le séminaire Numapresse