Numapresse
Pour une approche critique du Text Mining
Nous présentons la méthodologie du projet Numapresse qui s’appuie sur la collecte de données textuelles « enrichies » pour reconstituer des dispositifs éditoriaux de la presse ancienne…
Nous présentons la méthodologie du projet Numapresse qui s’appuie sur la collecte de données textuelles « enrichies » pour reconstituer des dispositifs éditoriaux de la presse ancienne…
Cette recherche s'appuie sur la totalité du catalogue de la BNF pendant tout le XIXe siècle, de 1800 à 1900 soit 3 419 594 « objets » correspondants à 568 550 identifiants.
Une extension documentée pour R permettant de créer des classifications automatisées
Présentation avec Matthieu Letourneux d'un essai de classification automatisée de 3000 romans policiers à partir des collections éditoriales pour le séminaire Numapresse