Alconost MQM Annotation Tool
Outil gratuit Alconost MQM Annotation Tool pour évaluer la qualité des traductions : annotation d’erreurs MQM, scoring et rapports depuis TSV/JSONL.
Qu'est-ce que l'Alconost MQM Annotation Tool ?
L'Alconost MQM Annotation Tool est un outil web pour l'évaluation de la qualité des traductions utilisant MQM (Multidimensional Quality Metrics), un cadre basé sur les erreurs utilisé dans les tâches partagées WMT et les benchmarks industriels. Il prend en charge les workflows avec intervention humaine pour annoter les erreurs de traduction selon les directives MQM, ainsi que l'analyse au niveau système et segment de ces annotations.
L'outil vous permet de télécharger des sorties de traduction, de marquer et catégoriser les erreurs selon la taxonomie MQM et leur gravité, et d'exporter des résultats structurés pour une évaluation ultérieure. Il convertit également les annotations MQM en un Quality Score (%) normalisé, comparable entre langues en tenant compte de la longueur de traduction via des tokens XLM-R SentencePiece.
Fonctionnalités principales
- Annotation d'erreurs selon les directives MQM pour sorties de traduction : annotez des catégories d'erreurs explicites et gravités au lieu d'utiliser uniquement des scores globaux.
- Couverture de la taxonomie MQM avec catégories et gravités granulaires : inclut des catégories comme Accuracy, Fluency et Terminology, avec niveaux de gravité Minor, Major et Critical.
- Exports structurés pour analyse : exporte les données annotées en formats TSV/CSV (tabulaire) et JSONL (JSON délimité par ligne) pour reporting système et segment.
- Reporting et analyses : inclut scoring de projet et vues d'insights comme graphiques de distribution d'erreurs et estimations de temps de session.
- Scoring automatisé basé sur pénalités normalisées par token : calcule pénalité totale comme Σ(compte d'erreurs × poids d'erreur) et dérive Quality Score (%) du compte total de tokens ; seuil pass/fail et poids d'erreurs configurables.
- Intégration API pour workflows import/export : fournit une REST API pour créer des projets, importer du contenu et exporter des résultats annotés (JSONL, TSV, CSV).
Comment utiliser l'Alconost MQM Annotation Tool
- Créez ou démarrez un projet d'annotation MQM dans l'outil.
- Téléchargez vos données contenant traductions source et cible (et optionnellement IDs de segments, IDs de systèmes et IDs de documents).
- Annotez les erreurs en utilisant les catégories MQM et niveaux de gravité. Pour marquer un segment comme vérifié sans erreurs, ajoutez une annotation « no-error ».
- Consultez le reporting du projet (incluant scoring et distributions d'erreurs) et exportez les données annotées pour analyse.
Pour l'automatisation, utilisez la REST API fournie pour importer des segments par programme et exporter les résultats en JSONL, TSV ou CSV.
Cas d'usage
- Évaluation qualité traduction humaine : linguistes annotent types d'erreurs MQM spécifiques (ex. Accuracy/Addition, Fluency/Grammar) pour produire un profil d'erreurs auditable.
- Comparaison systèmes traduction automatique : plusieurs sorties de systèmes peuvent être annotées et comparées via Quality Score normalisé et reporting de distribution d'erreurs.
- Workflows évaluation MT neuronal/LLM : annotez sorties de MT neuronal/LLM avec même taxonomie MQM pour évaluations cohérentes.
- Tests de régression et analyse d'erreurs : suivez évolution catégories d'erreurs spécifiques entre versions de modèles via exports d'annotations structurées.
- Revue QA vendor/interne avec annotation aveugle : annotateur complète annotation erreurs MQM pour base objective d'évaluation qualité traduction.
FAQ
Quels formats d'entrée sont pris en charge ? Les exemples de formats structurés de l'outil incluent TSV (tabulaire) et JSONL (JSON délimité par ligne). Il supporte aussi l'import CSV/TSV/JSONL et JSON brut via REST API.
Comment fonctionne le Quality Score (%) ? L'outil calcule une pénalité totale à partir des erreurs annotées via comptes d'erreurs et poids, puis normalise par compte total de tokens avec tokens XLM-R SentencePiece. Poids de gravité par défaut : Critical: 25, Major: 5, Minor: 1 ; seuil pass par défaut 99,0 % ou plus ; seuil pass/fail et poids ajustables.
Comment enregistrer qu'un segment n'a pas d'erreurs ?
Ajoutez une annotation avec catégorie no-error pour que le segment soit compté comme vérifié et correct, non ignoré ou en attente.
Puis-je inclure du contexte supplémentaire pour les annotateurs ?
Oui. Le champ context peut être fourni pour afficher infos supplémentaires dans l'interface d'annotation (ex. termes glossaire, liens référence, règles style).
Puis-je intégrer l'annotation MQM dans un workflow automatisé ? Oui. L'outil fournit une REST API avec spécification OpenAPI pour import/export automatisé de projets et résultats annotés.
Alternatives
- Outils d’annotation MQM (open source ou auto-hébergés) : si vous voulez une taxonomie MQM et un workflow d’annotation similaires mais gérez vous-même l’infrastructure, des outils open source inspirés de MQM peuvent convenir ; la principale différence est le contrôle du workflow et la responsabilité de la configuration.
- Analyse d’erreurs de traduction généraliste avec ensembles d’étiquettes personnalisés : des outils basés sur tableurs ou interfaces peuvent supporter l’annotation d’erreurs, mais vous devrez définir votre propre taxonomie/pondération et logique de scoring plutôt qu’utiliser un modèle centré sur MQM.
- Plateformes d’annotation avec pipelines d’export uniquement : des plateformes supportant les tâches de labellisation et exports structurés peuvent reproduire la partie « humain dans la boucle », mais elles ne fournissent pas forcément les structures de catégories/gravité spécifiques à MQM et le scoring normalisé par token prêtes à l’emploi.
- Tableaux de bord d’évaluation de qualité axés uniquement sur le scoring : certains outils se concentrent sur le calcul de métriques de qualité, mais sans annotation d’erreurs catégorielle style MQM et exports structurés, ils ne supportent pas la même granularité pour l’analyse d’erreurs.
Alternatives
Microsoft Translator
Traduisez rapidement des mots et des phrases entre l'anglais et plus de 100 langues.
Google Translate
Le service de Google, proposé gratuitement, traduit instantanément des mots, des phrases et des pages web entre l'anglais et plus de 100 autres langues.
LelaAI - Read & Learn
LelaAI - Read & Learn améliore votre compréhension et votre vocabulaire : enregistrez des articles, voyez les traductions sur le texte, hors ligne, sans pubs.
Talkpal
Talkpal est un professeur de langue AI qui aide les utilisateurs à apprendre les langues plus rapidement grâce à des conversations immersives et des retours en temps réel.
Rubriq
Rubriq est un outil IA pour la relecture et la traduction de textes académiques : résultats téléchargeables en quelques minutes et « mode de révision ».
Glarity
Glarity est une extension web IA gratuite pour résumer les vidéos YouTube et traduire des pages web, avec chat IA, AI search, ChatPDF et génération d’images.