Citation Mining for Classics Publications at Scale

Date:

More information here

Présentation

Les citations canoniques sont la manière standard de citer les sources primaires et sont présentes dans les publications scientifiques en études classiques. Leur importance réside dans le fait qu'elles signalent des passages ou extraits de textes – souvent en relation les uns avec les autres – qui ont été étudiés et discutés par des chercheurs. Bien que les lettres classiques aient longtemps exploité ce genre de citations en créant manuellement des index des passages cités, elles sont maintenant confrontées à un nouveau défi : comment extraire et exploiter la grande quantité de citations dans des archives de publications à grande échelle ?

Dans cette présentation, Matteo Romanello présentera les technologies d'extraction des références bibliographiques développées dans le projet Cited Loci pour l'extraction des citations canoniques. Il évoquera ensuite trois exemples d'application de ces technologies dans différents domaines :

  1. aider la compilation d'un index locorum dans un projet éditorial
  2. améliorer la capacité de trouver des publications pertinentes dans l'archive JSTOR
  3. étudier des aspects de la réception des auteurs classiques dans la littérature savante en utilisant les citations comment un proxy de leur succès

English presentation

Canonical citations are the standard way of citing primary sources and are found throughout publications in Classics. Their importance lies in that they signal text passages that were studied and discussed by scholars, often in relation to one another. While classicists have long been exploiting this kind citations by creating manually indexes of cited passages, they are now faced with a new challenge: how can the sheer amount of citations be captured from large-scale publication archives? In this talk I first present the citation mining technologies developed in the context of the Cited Loci project for the extraction of canonical references. I then discuss three applications of these technologies in different areas:

  1. to support the creation of an index locorum within a publication project
  2. to improve the retrieval of relevant publications from the JSTOR archive
  3. to study aspects of the scholarly reception of classical authors by using citations as a proxy of their success