Έκθεση ποιότητας μετάφρασης. Ιούνιος 2024

Ο στόχος αυτής της έκθεσης είναι να συγκρίνει την ποιότητα της μετάφρασης μεταξύ παλαιών και νέων γλωσσικών μοντέλων. Τα νέα μοντέλα δεν έχουν μόνο βελτιωμένη ποιότητα αλλά απόδοση και χρήση μνήμης. Χρησιμοποιήσαμε τη δοκιμή Metric και κυρίως Flores 101 στην αναφορά.

Το BLEU είναι οι πιο δημοφιλείς μετρήσεις στον κόσμο για την αξιολόγηση της μηχανικής μετάφρασης. Το σετ δοκιμών Flores 101 κυκλοφόρησε από την Facebook Research και έχει τη μεγαλύτερη κάλυψη ζεύγους γλώσσας.

Περιγραφή ποιότητας μετρήσεων

Μπίλου

Το Bleu είναι ένα αυτόματο μετρικό με βάση τα n-grams. Μετράει την ακρίβεια των n-grams της εξόδου της μηχανικής μετάφρασης σε σύγκριση με την αναφορά, σταθμισμένη με ποινή συντομίας για να τιμωρήσει τις υπερβολικά σύντομες μεταφράσεις. Χρησιμοποιούμε μια συγκεκριμένη εφαρμογή του Bleu, που ονομάζεται Sacrebleu. Εξάγει βαθμολογίες κορμών, όχι βαθμολογίες τμήματος.

Αναφορές

  • Papineni, Kishore, S. Roukos, Τ. Ward και Wei-Jing Zhu. "Bleu: Μια μέθοδος για την αυτόματη αξιολόγηση της μηχανικής μετάφρασης." ACL (2002).
  • Δημοσίευση, Ματ. "Μια κλήση για σαφήνεια στην αναφορά των βαθμολογιών Bleu." WMT (2018).

ΚΟΜΗΤΗΣ

Ο Comet (διασταυρούμενη βελτιστοποιημένη μέτρηση για την αξιολόγηση της μετάφρασης) είναι μια μέτρηση για την αυτόματη αξιολόγηση της μηχανικής μετάφρασης που υπολογίζει την ομοιότητα μεταξύ μιας εξόδου μετάφρασης μηχανής και μιας μετάφρασης αναφοράς χρησιμοποιώντας ενσωμάτωση συμβολικού ή προτάσεων. Σε αντίθεση με άλλες μετρήσεις, ο Comet εκπαιδεύεται στην πρόβλεψη διαφορετικών τύπων ανθρώπινων κρίσεων με τη μορφή της προσπάθειας μετά την επεξεργασία, της άμεσης αξιολόγησης ή της ανάλυσης σφάλματος μετάφρασης.

Αναφορές

Ενημερώσεις ιδιωτικού λογισμικού επί τόπου

Νέα έκδοση - 1.29.0.

Αλλαγές στη λειτουργικότητα:

  • Προστέθηκε υποστήριξη πρόσθετων μοντέλων για αναγνώριση ομιλίας.
  • Βελτιωμένη ποιότητα μετάφρασης εγγράφων.

Νέα έκδοση - 1.28.0.

Αλλαγές στη λειτουργικότητα:

  • Βελτιωμένη ποιότητα μετάφρασης.
  • Βελτίωσε την υπηρεσία Slack Bot.
  • Ενημερωμένες εξαρτήσεις.

Νέα έκδοση - 1.27.0.

Αλλαγές στη λειτουργικότητα:

  • Βελτιωμένη ποιότητα μετάφρασης.
  • Προστέθηκε υποστήριξη για το γλωσσάριο.
  • Βελτίωσε την υπηρεσία Slack Bot.
  • Βελτιωμένη ποιότητα μετάφρασης DOC, DOC.
  • Βελτιωμένη εργασία με εναλλακτικές παραλλαγές μετάφρασης.

Νέα έκδοση - 1.26.0.

Αλλαγές στη λειτουργικότητα:

  • Βελτιωμένες λειτουργίες εναλλακτικών παραλλαγών μετάφρασης.
  • Βελτιωμένη ποιότητα μετάφρασης.
  • Προστέθηκε κανονικοποιητής και denoiser για αναγνώριση ομιλίας.

Ζεύγη γλωσσών

Σημείωση: Το χαμηλότερο μέγεθος των μοντέλων στον σκληρό δίσκο σημαίνει τη χαμηλότερη κατανάλωση μνήμης GPU που οδηγεί σε μειωμένο κόστος ανάπτυξης. Το χαμηλότερο μέγεθος του μοντέλου έχει καλύτερη απόδοση στον χρόνο μετάφρασης. Η κατά προσέγγιση χρήση της μνήμης GPU υπολογίζεται ως μοντέλο σκληρού δίσκου μέγεθος x 1.2

Language PairCurrent
Model's
Size, mb
Test
Data
Previous
Model's
BLEU
Current
Model's
BLEU
DifferencePrevious
Model's
COMET
Current
Model's
COMET
Difference
Αγγλικά - Αραβικά190,63Flores 10133,2133,40+0,1987,8188,27+0,46
Ελληνικά - Αγγλικά184,00Lingvanex62,9364,45+1,5291,8692,39+0,53
Λιθουανία - Αγγλικά113,91Flores 10134,0634,96+0,9085,7486,24+0,50
Αγγλικά - Κροατικά184,00Flores 10131,1834,95+3,7789,0391,09+2,06
Ρωσικά - Καζακ190,63Lingvanex38,1038,39+0,2992,0692,13+0,07
Καζάκ - Ρώσο190,63Flores 20022,7522,79+0,0487,5988,12+0,53
Καταλανική - Αγγλικά113,91Flores 10146,4447,54+1,1088,0588,55+0,50
Hmong - Αγγλικά113,91Νάρκη20,3621,30+0.9460,8961,95+1,06
Γερμανικά - Αγγλικά190,65Νάρκη38,6940,96+2,2787,5287,98+0,46
Αγγλικά - Ισπανικά184,02Lingvanex62,8263,04+0,2293,4493,50+0,06
Νεπάλ - Αγγλικά113,91Flores 10133,6441,67+8,0388,4889,94+1,46
Τατζίκ - Αγγλικά113,91Flores 10132,1933,74+1,5576,1077,46+1,36
Αγγλικά - Λιθουανικά113,91Flores 10130,8431,28+0,4489,6190,11+0,50
Αγγλικά - Εσθονία113,91Flores 10130,9331,48+0,5591,0991,64+0,55
Ουκρανία - Αγγλικά184,00Flores 10141,1541,54+0,3986,9286,98+0,06
Αγγλικά - Εβραϊκά184,11Flores 10135,4236,00+0,9187,8788,53+0,66
Αγγλικά - Μαλαισία184,11Flores 10144,1244,63+0,5189,4189,77+0,36
Εσθονική - Αγγλικά113,91Flores 10139,1941,07+1,8888,8188,33+0,52
Ιαπωνικά - Αγγλικά190,63Flores 10129,5931,05+1,4687,2888,08+0,80
Αγγλικά - Ουκρανία184,00Flores 10129,5934,30+4,7287,0689,88+2,82
Γαλλικά - Αγγλικά190,65Flores 10148,3548,82+0,4789,3189,46+0,15
Herbew - Αγγλικά184,11Flores 10145,0146,31+1,3087,8288,82+0,50
Αλβανία - Αγγλικά113,91Lingvanex55,4356,43+1,0086,6387,83+1,20
Αγγλικά - hmong113,91Lingvanex42,2660,99+18,7375,4877,35+1,87

Συχνές ερωτήσεις (FAQ)

Πώς να αξιολογήσετε την ποιότητα της μετάφρασης;

Η ποιότητα της μετάφρασης μπορεί να αξιολογηθεί με χειροκίνητες και αυτόματες προσεγγίσεις. Η χειροκίνητη αξιολόγηση περιλαμβάνει τους μεταφραστές που ελέγχουν τα κείμενα για ακρίβεια και αναζητούν σφάλματα. Η αυτόματη προσέγγιση της αξιολόγησης της μηχανικής μετάφρασης προϋποθέτει τη χρήση συγκεκριμένων μετρήσεων όπως το BLEU, ο Comet, ο Meteor και άλλοι.

Γιατί χρειαζόμαστε αξιολόγηση ποιότητας μετάφρασης;

Η αξιολόγηση της ποιότητας της μετάφρασης διασφαλίζει ότι τα μεταφρασμένα κείμενα πληρούν τα απαιτούμενα πρότυπα. Επιτρέπει στους γλωσσολόγους να αξιολογούν την ακρίβεια, την ευχέρεια και την αντιστοιχία του μεταφρασμένου κειμένου στον επιδιωκόμενο σκοπό του. Για την αξιολόγηση της ποιότητας των συστημάτων μεταφράσεων μηχανών είναι σημαντική για τη βελτίωση των κινητήρων τους, τη σύγκριση διαφορετικών παρόχων MT και τον προσδιορισμό των δυνάμεων και των αδυναμιών για μελλοντική ανάπτυξη.

Πώς μπορείτε να βελτιώσετε την ποιότητα της μετάφρασης;

Υπάρχουν πολλοί τρόποι βελτίωσης της ποιότητας των μεταφράσεων σας:
1. Ορίστε σαφή πρότυπα ή κατευθυντήριες γραμμές
2. Κρατήστε ελέγχους ποιότητας σε πολλαπλά στάδια μιας διαδικασίας μετάφρασης
3. Εξασφαλίστε τις ανθρώπινες αναθεωρήσεις των μεταφρασμένων κειμένων
4. Μίσθωση επαγγελματιών μεταφραστών με κατάλληλες δεξιότητες
5. Εκπαιδεύστε συνεχώς μοντέλα MT και βελτιώστε τα
6. Χρησιμοποιήστε προηγμένες τεχνικές NLP για να εξασφαλίσετε την ακρίβεια
7. Συνδυάστε το MT με την ανθρώπινη μετα-επεξεργασία για να έχετε τα καλύτερα αποτελέσματα
8. Συλλέξτε και αναλύστε τα σχόλια από τους πελάτες σας

Περισσότερες διαβάσει αναμονή

Το καλύτερο μοντέλο μετάφρασης αγγλικών-αραβικών στον κόσμο

Το καλύτερο μοντέλο μετάφρασης αγγλικών-αραβικών στον κόσμο

March 6, 2025

Κείμενο σε ομιλία για τηλεφωνικά κέντρα

Κείμενο σε ομιλία για τηλεφωνικά κέντρα

January 8, 2025

AI Περιεχόμενο γενιάς εναντίον ανθρώπινων συγγραφέων: χτυπώντας τη σωστή ισορροπία

AI Περιεχόμενο γενιάς εναντίον ανθρώπινων συγγραφέων: χτυπώντας τη σωστή ισορροπία

December 18, 2024

Επικοινωνήστε μαζί μας

* Απαιτούμενα πεδία

Υποβάλλοντας αυτό το έντυπο, συμφωνώ ότι οι Όροι Παροχής Υπηρεσιών και Πολιτική Προστασίας Προσωπικών Δεδομένων θα διέπουν τη χρήση των υπηρεσιών που λαμβάνω και τα προσωπικά δεδομένα που παρέχω αντίστοιχα.

E-mail

Ολοκληρώθηκε το

Το αίτημά σας έχει αποσταλεί με επιτυχία

×