Emmanuel Van Elverdinghe - Recurrent Pattern Modelling in a Corpus of Armenian Manuscript Colophons

jdmdh:1401 - Journal of Data Mining & Digital Humanities, 11 janvier 2018, Numéro spécial sur le traitement assisté par ordinateur de l‘intertextualité dans les langues anciennes - https://doi.org/10.46298/jdmdh.1401
Recurrent Pattern Modelling in a Corpus of Armenian Manuscript ColophonsArticle

Auteurs : Emmanuel Van Elverdinghe ORCID

    Colophons of Armenian manuscripts are replete with yet untapped riches. Formulae are not the least among them: these recurrent stereotypical patterns conceal many clues as to the schools and networks of production and diffusion of books in Armenian communities. This paper proposes a methodology for exploiting these sources, as elaborated in the framework of a PhD research project about Armenian colophon formulae. Firstly, the reader is briefly introduced to the corpus of Armenian colophons and then, to the purposes of our project. In the third place, we describe our methodology, relying on lemmatization and modelling of patterns into automata. Fourthly and finally, the whole process is illustrated by a basic case study, the occasion of which is taken to outline the kind of results that can be achieved by combining this methodology with a philologico-historical approach to colophons.


    Volume : Numéro spécial sur le traitement assisté par ordinateur de l‘intertextualité dans les langues anciennes
    Rubrique : Vers un écosystème numérique : NLP. Infrastructure de corpus. Méthodes de récupération des textes et de calcul des similarités de textes
    Publié le : 11 janvier 2018
    Accepté le : 11 janvier 2018
    Soumis le : 7 mars 2016
    Mots-clés : codicology,Unitex,finite state transducers,Armenian colophons,automata,colophon formula,formulaic patterns,lemmatization,manuscript studies,[SHS.LITT] Humanities and Social Sciences/Literature,[SHS.HIST] Humanities and Social Sciences/History

    Statistiques de consultation

    Cette page a été consultée 3291 fois.
    Le PDF de cet article a été téléchargé 605 fois.