Accueil > Cartographie des Données Textuelles

OMIN 2010 - Cartographie des données textuelles

Type d'enseignement : Atelier

Semestre : Automne 2017-2018

Nombre d'heures : 24

Langue d'enseignement : français

Pré-requis

Le cours s'appuie sur certaines notions en analyse de réseau, statistiques ou même en informatique. Pour autant ces concepts seront introduits au fil du semestre si bien qu'il n'existe pas de pré-requis formel pour s'inscrire à cet enseignement.

Descriptif du cours

L'objectif de ce cours est de former les étudiants à la l'analyse quantitative de données et plus particulièrement à la cartographie de corpus textuels. Les concepts et outils analytiques seront présentés au travers de textes de références et des cas d'étude adaptés mais le cours prendra essentiellement la forme d'un atelier durant lequel les étudiants seront confrontés à des projets pratiques d'analyse de données en petits groupes. Les projets pourront s'appuyer sur une large variété de sources en ligne (Twitter, Facebook, commentaires, etc.), ou hors ligne (articles de presse, discours politiques, etc.) et engageront les étudiants à toutes les étapes d'un projet de cartographie: de la constitution des corpus à la visualisation des résultats en passant par la mise en place de la bonne stratégie d'analyse avec le souci constant de répondre à une question de recherche précise. Naturellement les sujets choisis pourront être liés aux projets de recherche conduits par les étudiants durant leur année de master.

Enseignants

COINTET, Jean-Philippe (Associate professor)

Format pédagogique

Travail en groupe, les étudiants sont invités à amener leur ordinateur portable pour manipuler eux même les données et les outils qui seront présentés.

Mode de validation

Les étudiants travailleront essentiellement au sein de groupes de deux ou trois personnes qui seront évalués collectivement (pour 70% de la note finale). Un travail personnel complémentaire sera également demandé. Les étudiants devront concevoir dans un papier final une stratégie d'analyse quantitative adaptée au projet qu'ils mènent au sein du master. Enfin, certaines séances débuteront par la présentation d'un papier par un étudiant. Cette présentation donnera également lieu à une évaluation (10% de la note)

Charge de travail

En plus d'une participation active en classe, les étudiants devront préparer la séance suivante en lisant des articles ou en finalisant leur travail de groupe. Deux heures de travail complémentaire hebdomadaire sont à prévoir en moyenne.

Lectures principales demandées

  • Lazer, David, et al. "Life in the network: the coming age of computational social science." Science (New York, NY) 323.5915 (2009): 721.
  • Manovich, L., 2011. Trending : The promises and the challenges of big social data. Debates in the digital humanities 2, 460–475.
  • Michel, J. B., Shen, Y. K., Aiden, A. P., Veres, A., Gray, M. K., The Google Books Team, Pickett, J. P., Hoiberg, D., Clancy, D., Norvig, P., Orwant, J., Pinker, S., Nowak, M. A., Aiden, E. L., Jan. 2011. Quantitative Analysis of Culture Using Millions of Digitized Books. Science (New York, NY) 331 (6014), 176–182.
  • Barberá, Pablo, et al. "Tweeting from left to right: Is online political communication more than an echo chamber?." Psychological science 26.10 (2015): 1531-1542.

Lectures complémentaires demandées

  • Evans, James A., and Pedro Aceves. "Machine translation: mining text for social theory." Annual Review of Sociology 42 (2016): 21-50.
  • Bakshy, Eytan, Solomon Messing, and Lada A. Adamic. "Exposure to ideologically diverse news and opinion on Facebook." Science 348.6239 (2015): 1130-1132.
  • McFarland, D. A., Lewis, K., Goldberg, A., Sep. 2015. Sociology in the Era of Big Data : The Ascent of Forensic Social Science. The American Sociologist.
  • Rule, Alix, Jean-Philippe Cointet, and Peter S. Bearman. "Lexical shifts, substantive changes, and continuity in State of the Union discourse, 1790–2014." Proceedings of the National Academy of Sciences 112.35 (2015): 10837-10844.
  • Boyd, Danah, and Kate Crawford. "Six provocations for big data." A decade in internet time: Symposium on the dynamics of the internet and society. Vol. 21. Oxford: Oxford Internet Institute, 2011.