Έκθεση ποιότητας μετάφρασης. Ιανουάριος 2024

Ο στόχος αυτής της έκθεσης είναι να συγκρίνει την ποιότητα της μετάφρασης μεταξύ παλαιών και νέων γλωσσικών μοντέλων. Τα νέα μοντέλα δεν έχουν μόνο βελτιωμένη ποιότητα αλλά απόδοση και χρήση μνήμης. Χρησιμοποιήσαμε τη δοκιμή Metric και κυρίως Flores 101 στην αναφορά.

Το Bleu είναι οι πιο δημοφιλείς μετρήσεις στον κόσμο για την αξιολόγηση της μηχανικής μετάφρασης. Το σετ δοκιμών Flores 101 κυκλοφόρησε από την Facebook Research και έχει τη μεγαλύτερη κάλυψη ζεύγους γλώσσας.

Περιγραφή ποιότητας μετρήσεων

Μπίλου

Το Bleu είναι μια αυτόματη μέτρηση που βασίζεται σε n-grams. Μετράει την ακρίβεια των n-grams της εξόδου της μηχανικής μετάφρασης σε σύγκριση με την αναφορά, σταθμισμένη με ποινή συντομίας για να τιμωρήσει τις υπερβολικά σύντομες μεταφράσεις. Χρησιμοποιούμε μια συγκεκριμένη εφαρμογή του Bleu, που ονομάζεται Sacrebleu. Εξάγει βαθμολογίες κορμών, όχι βαθμολογίες τμήματος.

Αναφορές

  • Papineni, Kishore, S. Roukos, Τ. Ward και Wei-Jing Zhu. "Bleu: Μια μέθοδος για την αυτόματη αξιολόγηση της μηχανικής μετάφρασης." ACL (2002).
  • Δημοσίευση, Ματ. "Μια κλήση για σαφήνεια στην αναφορά των βαθμολογιών Bleu." WMT (2018).

ΚΟΜΗΤΗΣ

Ο Comet (διασταυρούμενη βελτιστοποιημένη μέτρηση για την αξιολόγηση της μετάφρασης) είναι μια μέτρηση για την αυτόματη αξιολόγηση της μηχανικής μετάφρασης που υπολογίζει την ομοιότητα μεταξύ μιας εξόδου μετάφρασης μηχανής και μιας μετάφρασης αναφοράς χρησιμοποιώντας ενσωμάτωση συμβολικού ή προτάσεων. Σε αντίθεση με άλλες μετρήσεις, ο Comet εκπαιδεύεται στην πρόβλεψη διαφορετικών τύπων ανθρώπινων κρίσεων με τη μορφή της προσπάθειας μετά την επεξεργασία, της άμεσης αξιολόγησης ή της ανάλυσης σφάλματος μετάφρασης.

Αναφορές

Οι ενημερώσεις λογισμικού Lingvanex On-Premise

Νέα έκδοση - 1.19.0.

Αλλαγές στη λειτουργικότητα:

  • Βελτιωμένη αραβική μεταγραφή για μετάφραση κειμένου.
  • Προστέθηκε σελίδα επίδειξης για τον αναγνώστη ομιλίας.
  • Προστέθηκε η δυνατότητα μετάφρασης της μεταγραφής φωνής σε χαλαρό-bot. Επίσης, μερικές δευτερεύουσες διορθώσεις σφαλμάτων. (Ειδοποίηση: Μετά την ενημέρωση του Lingvanex Slack-Bot, είναι απαραίτητο να ενημερώσετε το δηλωτικό και να επανεγκαταστήσετε το bot).

Νέα έκδοση - 1.20.0.

Αλλαγές στη λειτουργικότητα:

  • Προστέθηκε η επιλογή για τον περιορισμό της αυτόματης ανίχνευσης μόνο στις γλώσσες που αναπτύσσονται στον διακομιστή (ελέγξτε τα στοιχεία στην τεκμηρίωση).
  • Μικρές βελτιώσεις στην ποιότητα της μετάφρασης.

Νέα έκδοση - 1.21.0.

Αλλαγές στη λειτουργικότητα:

  • Προστέθηκε νέα εφαρμογή του Autodetect της γλώσσας.
  • Βελτιωμένη σελίδα επίδειξης για τον αναγνώστη ομιλίας.
  • Μικρές βελτιώσεις στην ποιότητα της μετάφρασης.

Βελτιωμένα μοντέλα γλωσσών

Μετρήσεις bleu

image_blog

Βελτιωμένα μοντέλα γλωσσών. Ιανουάριος 2024

Μετρήσεις κομήτων

image_blog

Βελτιωμένα μοντέλα γλωσσών. Ιανουάριος 2024

Ζεύγη γλωσσών

Σημείωση: Το χαμηλότερο μέγεθος των μοντέλων στον σκληρό δίσκο σημαίνει τη χαμηλότερη κατανάλωση μνήμης GPU που οδηγεί σε μειωμένο κόστος ανάπτυξης. Το χαμηλότερο μέγεθος του μοντέλου έχει καλύτερη απόδοση στον χρόνο μετάφρασης. Η κατά προσέγγιση χρήση της μνήμης GPU υπολογίζεται ως μοντέλο σκληρού δίσκου μέγεθος x 1.2

image_blog

Περισσότερες διαβάσει αναμονή

Το καλύτερο μοντέλο μετάφρασης αγγλικών-αραβικών στον κόσμο

Το καλύτερο μοντέλο μετάφρασης αγγλικών-αραβικών στον κόσμο

March 6, 2025

Κείμενο σε ομιλία για τηλεφωνικά κέντρα

Κείμενο σε ομιλία για τηλεφωνικά κέντρα

January 8, 2025

AI Περιεχόμενο γενιάς εναντίον ανθρώπινων συγγραφέων: χτυπώντας τη σωστή ισορροπία

AI Περιεχόμενο γενιάς εναντίον ανθρώπινων συγγραφέων: χτυπώντας τη σωστή ισορροπία

December 18, 2024

Επικοινωνήστε μαζί μας

* Απαιτούμενα πεδία

Υποβάλλοντας αυτό το έντυπο, συμφωνώ ότι οι Όροι Παροχής Υπηρεσιών και Πολιτική Προστασίας Προσωπικών Δεδομένων θα διέπουν τη χρήση των υπηρεσιών που λαμβάνω και τα προσωπικά δεδομένα που παρέχω αντίστοιχα.

E-mail

Ολοκληρώθηκε το

Το αίτημά σας έχει αποσταλεί με επιτυχία

×