III. Biotraduction vs. traduction automatique


Le projet OPTIMICE : une optimisation de la qualité des traductions de métadonnées par la collaboration entre acteurs du monde scientifique et traduction automatique

Katell Hernandez Morin ; Franck Barbin.
Le projet OPTIMICE, pour optimisation de la traduction automatique des métadonnées et de son insertion dans la chaîne éditoriale, vise à concevoir une méthode, transférable à d'autres revues et domaines disciplinaires, en combinant la traduction automatique neuronale (DeepL) et la post-édition humaine pour améliorer la qualité des métadonnées des articles (résumés, mots-clés, etc.) du français vers l'anglais dans le processus éditorial des revues. Une équipe de traducteurs-traductologues a travaillé sur quatre revues éditées par les Presses universitaires de Rennes (PUR), en collaboration avec les comités éditoriaux et la MSHB (Maison des sciences de l'Homme en Bretagne). La traduction des métadonnées d'articles par leurs auteurs et par la traduction automatique a été évaluée comparativement. Une enquête sur les pratiques de traduction des chercheurs en SHS a été menée, et des recommandations de rédaction et de traduction des métadonnées ont été formulées pour l'insertion concertée de la méthodologie au sein du processus éditorial. Mots-clés TAN (traduction automatique neuronale); post-édition; SHS; métadonnées; revues

DeepL et Google Translate face à l'ambiguïté phraséologique

Françoise Bacquelaine.
Malgré les progrès de la traduction automatique neuronale, l'intelligence artificielle ne permet toujours pas à la machine de comprendre pour déjouer tous les pièges de la traduction, notamment ceux de l'ambiguïté lexicale, phraséologique, syntaxique et sémantique (Koehn 2020). Deux structures portugaises moyennement figées présentent les caractéristiques des « unités de construction préformées » (UCP) décrites par Schmale (2013). Elles relèvent donc de la phraséologie au sens large et doivent être traduites en bloc. Les principaux défis de traduction en bloc que lancent ces UCP binaires à la machine résultent, d'une part, de variables simples ou complexes, et, d'autre part, des propriétés syntaxiques de scission et d'inversion des éléments sur l'axe syntagmatique. Un échantillon de 168 occurrences de ces UCP en contexte phrastique a été prélevé sur un corpus journalistique portugais. Cet échantillon a été traduit en français par DeepL et Google Translate en 2019 et en 2021. Les traductions automatiques brutes ont été confrontées à un modèle de biotraduction établi à partir de corpus parallèles ou alignés portugais-français et analysées en fonction de deux critères généraux (non-littéralité et acceptabilité) et de quelques défis spécifiques à chaque UCP. Cette analyse permet d'évaluer l'évolution de ces deux systèmes de traduction automatique face à l'ambiguïté phraséologique et d'en tirer des conclusions quant […]