Les projets de digital humanities soutenus par Google

Suite au lancement de son programme de soutien aux digital humanities en avril dernier, Google annonce un financement de près d’un million de dollars pour une série de projets d’étude basés sur l’utilisation de Google Books au cours des deux prochaines années. Il mettra à disposition des lauréats des outils, des technologies, une expertise et des corpus de livres.

Google mise donc sur les digital humanities pour progresser dans la compréhension de son gisement de 12 millions de livres numérisés dans plus de 400 langues:

« les chercheurs en sciences humaines commencent à appliquer les techniques de recherche quantitative pour répondre aux questions qui exigent l’examen de milliers ou de millions de livres. Ce style de recherche complète les méthodes de nombreux chercheurs contemporains en sciences humaines, qui ont réalisé individuellement de grandes avancées à travers la lecture en profondeur et une analyse minutieuse des dizaines ou des centaines de textes. Nous croyons que les deux approches ont leur mérite, et que chacune est bonne pour répondre à différents types de questions ».

On voit, à travers les 12 projets retenus (9 américains, 2 anglais et 1 espagnol), listés ci-dessous, que Google se centre surtout sur l’analyse de textes et on note que certains concernent la conception d’outils :

  • Identification et extraction automatique de passages linguistiques structurés dans les textes – Steven Abney and Terry Szymanski, University of Michigan
  • Découvrir des entités géographiques historiques dans le corpus de Google Books- Elton Barker, The Open University, Eric C. Kansa, University of California-Berkeley, Leif Isaksen, University of Southampton, United Kingdom. Google Ancient Places (GAP)
  • Recadrage de l’époque victorienne- Dan Cohen and Fred Gibbs, George Mason University. Reframing the Victorians
  • Les études classiques dans Google Books – Gregory R. Crane, Tufts University
  • Relever le défi du changement de langue en recherche textuelle avec des techniques de traduction automatique – Miles Efron, Graduate School of Library and Information Science, University of Illinois
  • Les métadonnées des livres de l’époque moderne dans Google Book – Brian Geiger, University of California-Riverside, Benjamin Pauley, Eastern Connecticut State University
  • L’encyclopédie ouverte des sites «classiques» – David Mimno and David Blei, Princeton University
  • Bibliotheca Academica Translationum: lien à Google Books – Alfonso Moreno, Magdalen College, University of Oxford. Bibliotheca Academica Translationum
  • Hypercities Geo-Scribe – Todd Presner, David Shepard, Chris Johanson, James Lee, University of California-Los Angeles
  • Annotation collaborative des textes littéraires numérisés – Amelia del Rosario Sanz-Cabrerizo and José Luis Sierra-Rodríguez, Universidad Complutense de Madrid
  • JUXTA, outil de comparaison pour le web – Andrew Stauffer, University of Virginia
  • Outils et techniques pour l’analyse littéraire automatisée, reposant sur le corpus scandinave de Google Books – Timothy R. Tangherlini, University of California-Los Angeles, Peter Leonard, University of Washington