Analyse de données textuelles et sciences sociales : application et comparaison de deux outils, Calliope et Alceste
Abstract
L'accès à des corpus textuels, d'une taille inhabituelle et d'un type nouveau, se voit largement facilité de nos jours (politique d'ouverture des données publiques, partage des données avec le web sémantique, sources web de contenus tels que les réseaux sociaux, etc.). Cette plus grande commodité d'accès nécessite le recours à des méthodes et des outils informatisés capables de traiter et d'analyser cette masse d'informations. L'analyse de données textuelles fait partie de ces méthodes d'exploration des données, basées sur des principes statistiques et linguistiques. La lecture à distance des données qu'elle permet, tout en étant fondée sur elles, représente une opportunité pour la démarche scientifique : les pistes interprétatives que l'analyse lexicométrique propose sont autant de nouveaux questionnements scientifiques. Pourtant, ces méthodes sont encore peu pratiquées en sciences sociales. Notre travail vise à montrer l'intérêt que peut représenter l'intégration d'une telle démarche au sein d'un projet de recherche en sociologie, en procédant à l'analyse lexicométrique du vocabulaire du phénomène mémoriel. Pour cela, nous avons appliqué deux logiciels d'analyse de données textuelles, Calliope et Alceste, au même corpus de données : les déclarations d'associations au Journal officiel. Ce travail se veut doublement exploratoire : établir une méthodologie d'analyse des données qui en révèle les risques potentiels pour mieux les déjouer et proposer des pistes de réflexion dans le cadre d'un prolongement du projet de recherche. L'un des apports de ce travail est de montrer que le recours à de multiples outils d'analyse de données textuelles constitue une réelle complémentarité, bénéfique aux projets de recherche, en sciences sociales notamment.
Keywords
Analyse de données
Texte
Analyse de mots associés
Analyse lexicale
Analyse statistique
Comparaison
Logiciel
Traitement des données
Lemmatisation
Methode
Sociologie
Mémoire
Recherche scientifique
Document textuel
Cluster
Cooccurrence
Humanités numériques
France
Calliope
Alceste
Journal officiel
Sarah Gensburger
Domains
Loading...