Projets sélectionnés par « Digging into Data Challenge »

Dans le cadre de Digging into Data Challenge, programme d’extraction et d’analyse des données à grande échelle en SHS, huit projets ont été sélectionnés et recevront un financement pour leur réalisation :

  • projet relatif à l’histoire criminelle sur Old Bailey Online, collection de comptes-rendus des procès de la cour de justice criminelle de Londres (universités George Mason, d’Alberta et Hertfordshire) : il a une valeur exemplaire sur le rôle de la fouille de données dans une discipline historique importante et vise à illustrer comment les outils fournis par les digital humanities (Tapor…) peuvent être utilisés pour extraire de nouvelles connaissances d’un vaste ensemble de données.
  • projet d’éditions dynamiques «variorum» (universités Mount Allison et Tufts, Imperial College de Londres): création d’un cadre pour produire des éditions dynamiques « variorum » permettant aux lecteurs de faire le lien entre les différentes éditions mais aussi avec les citations, les personnes, les lieux, trouvés dans un corpus de plus d’un million de textes.
  • projet de fouille d’images pour répondre aux questions de paternité d’oeuvres (universités du Michigan, de l’Illinois, d’Urbana-Champaign et de Sheffield) : il explorera la paternité de manuscrits du 15ème siècle, de cartes du 17ème et du 18ème siècle et de documents du 19 et 20e siècle.
  • projet sur le siècle des lumières: cartographie de la république des lettres (universités d’Oklahoma, de d’Oxford et de Stanford): analyse d’un corpus de 53 000 lettres écrites au 18e siècle afin d’observer l’influence de la culture de l’époque.
  • projet sur un ensemble de données orales pour la recherche linguistique sur le web (universités McGill et Cornell) : moissonnage de données à partir d’enregistrements (podcasts, conférences…) et analyse sur le corpus résultant des usages de la prosodie (rythme, accent, intonations) dans la communication parlée.
  • projet de fouilles de données et d’analyse du discours (universités d’Oxford et de Pennsylvanie): analyse de 9.000 heures de fichiers audio parlés de corpus britanniques et américains contenant une grande variété d’expression permettant de nouveaux types d’analyse linguistique.
  • analyse structurelle de grandes quantités d’information musicale (universités de l’Illinois, Urbana-Champaign, Southampton et McGill) : recueil d’environ 23 000 heures de musique numérisée représentant un large éventail de styles, des régions et de périodes dont l’objectif est de développer des outils pour identifier et analyser les structures sous-jacentes d’un corpus de musique du monde et fournir ainsi aux chercheurs de nouveaux moyens d’analyse.
  • projet sur les chemins de fer et le développement de l’Amérique moderne (universités Portsmouth et Nebraska-Lincoln):} il portera sur une vaste collection de données textuelles, géographiques et numériques et fournira une représentation des chemins de fer et de son impact sur la société aux Etats-Unis à l’aide d’outils de corrélation, d’analyse et de visualisation spatio-temporelles.

Le programme est co-financé par Joint Information Systems Committee (JISC) en Grande-Bretagne,  Social Sciences and Humanities Research Council (SSHRC) au Canada, National Endowment for the Humanities (NEH) et National Science Foundation (NSF) aux Etats-Unis.