Due to the widespread use of data-driven neural machine translation, both by professional translators and layperson users, an adequate machine translation literacy on the part of the users of this technology is becoming more and more important. At the same time, the increasing datafication of both the private and the business sphere requires an adequate data literacy in modern society. The present article takes a closer look at machine translation literacy and data literacy and investigates the interface between the two concepts. This is done to lay the preliminary theoretical foundations for a didactic project aiming to develop didactic resources for teaching data literacy in its machine translation-specific form to students of BA programmes in translation/specialised communication.
Nous présentons différentes méthodes et outils empiriques qui sont susceptibles d’objectiver et d’optimiser l'évaluation des textes traduits en tant que corpus de traduction parallèles produits par des traducteurs professionnels ou par un service de traduction automatique. Les méthodes et outils proposés prennent appui sur une analyse empirique du traitement de l’information dans les textes traduits ainsi que sur le rôle utilitaire de la traduction automatique et de ses méthodes, et elles peuvent être mises en œuvre dans un appareillage outillé d'évaluation des traductions dans un contexte professionnel. La partie saillante de ces méthodes (qui peuvent être déployées automatiquement ou manuellement) repose sur la comparaison de deux paramètres mesurables dans la plupart des langues naturelles, à savoir la longueur des segments en caractères et le nombre de mots lexicaux qu'ils contiennent. Nos travaux récents (Poirier, 2017 et Poirier, 2021) ont montré que ces paramètres ont une forte corrélation positive en traduction (supérieure à 0,9 en règle générale, et dépassant le plus souvent 0,95) : plus le segment source contient de caractères ou de mots lexicaux, plus la traduction contient de caractères ou de mots lexicaux. La mesure des mots lexicaux et du volume informationnel des traductions permet de distinguer les traductions hétéromorphes (information en surplus ou en moins) des segments isomorphes (même contenu informationnel). […]