Martti Mäkinen - Stylo visualisations of Middle English documents

jdmdh:5614 - Journal of Data Mining & Digital Humanities, 23 décembre 2020, Numéro spécial sur les visualisations en linguistique historique - https://doi.org/10.46298/jdmdh.5614
Stylo visualisations of Middle English documentsArticle

Auteurs : Martti Mäkinen ORCID1

  • 1 Hanken School of Economics

Automated approaches to identifying authorship of a text have become commonplace in the stylometric studies. The current article applies an unsupervised stylometric approach on Middle English documents using the script Stylo in R, in an attempt to distinguish between texts from different dialectal areas. The approach is based on the distribution of character 3-grams generated from the texts of the corpus of Middle English Local Documents (MELD). The article adopts the middle ground in the study of Middle English spelling variation, between the concept of relational linguistic space and the real linguistic continuum of medieval England. Stylo can distinguish between Middle English dialects by using the less frequent character 3-grams.


Volume : Numéro spécial sur les visualisations en linguistique historique
Publié le : 23 décembre 2020
Accepté le : 12 décembre 2020
Soumis le : 8 juillet 2019
Mots-clés : Middle English,historical dialectology,diatopical variation,unattended analysis,stylometry,authorship attribution,R,non-standard spelling,[SHS.LANGUE]Humanities and Social Sciences/Linguistics,[SHS]Humanities and Social Sciences

Statistiques de consultation

Cette page a été consultée 2151 fois.
Le PDF de cet article a été téléchargé 608 fois.