Creeu el vostre propi sistema de traducció automàtica per a qualsevol domini i tasca empresarial
Kit d'eines de traducció automàtica
Preparació de dades
Analitzar, filtrar, marcar corpus paral·lels i monolingües. Creeu blocs per a dades de prova i validació
Formació de models
Entrena l’arquitectura neuronal personalitzada amb llistes de treballs paral·leles, anàlisis de GPU i estimació de qualitat
Desplegament
Quan acabi l’entrenament del model, es pot desplegar automàticament com a API o disponible per descarregar-lo per utilitzar-lo fora de línia
De novell a expert
Dashboard combina les últimes tècniques lingüístiques i estadístiques que s’utilitzen per entrenar el programari als dominis dels clients i millorar la qualitat de la traducció. A la imatge següent: a la dreta hi ha una llista de tasques i servidors GPU sobre els quals s’estan entrenant els models. Al centre hi ha els paràmetres de la xarxa neuronal i, a continuació, els conjunts de dades que s’utilitzaran per a l’entrenament.

Treballar amb dades paral·leles
El treball en un nou llenguatge va començar amb la preparació de conjunts de dades. El tauler té molts conjunts de dades predefinits de fonts obertes com la Viquipèdia, el Parlament Europeu, Paracrawl, Tatoeba i altres. Per aconseguir una qualitat de traducció mitjana, n’hi ha prou amb 5 milions de línies traduïdes.

Afinació del diccionari i del tokenitzador
Els conjunts de dades són línies de text traduïdes d’un idioma a un altre. A continuació, el tokenitzador divideix el text en fitxes i crea diccionaris a partir d’ells, ordenats per la freqüència de trobada amb el testimoni. El testimoni pot ser caràcters individuals, síl·labes o paraules senceres. Amb Lingvanex Data Studio podeu controlar tot el procés de creació de diccionaris de testimonis SentencePiece per a cada idioma per separat.

Filtrat de dades i estimació de qualitat
Hi ha més de 20 filtres disponibles per filtrar corpus paral·lels i monolingües per obtenir el conjunt de dades de qualitat a partir de dades analitzades o de codi obert. Podeu marcar entitats amb nom, dígits i qualsevol altre testimoni per entrenar el sistema per deixar algunes paraules sense traduir o traduïdes d’una manera específica.

Contacta amb nosaltres ara
I obteniu accés gratuït a les nostres solucions!