Ustvarite svoj sistem strojnega prevajanja za katero koli domeno in poslovno nalogo
Komplet orodij za strojno prevajanje
Priprava podatkov
Razčlenjevanje, filtriranje, označevanje vzporednih in enojezičnih korpusov. Ustvarite bloke za testne in validacijske podatke
Model Usposabljanje
Urite nevronsko arhitekturo po meri z vzporednimi seznami opravil, analitiko GPU in oceno kakovosti
Razporeditev
Ko je usposabljanje modela končano, ga je mogoče samodejno uvesti kot API ali pa je na voljo za prenos za uporabo brez povezave
Od Novic do Strokovnjak
Nadzorna plošča združuje najnovejše jezikovne in statistične tehnike, ki se uporabljajo za usposabljanje programske opreme za domene strank in izboljšanje kakovosti prevoda. Na spodnji sliki: na desni strani je seznam nalog in GPU strežnikov, na katerih se modeli urijo. V sredini so parametri nevronske mreže, spodaj pa nabori podatkov, ki bodo uporabljeni za usposabljanje.

Delo z Vzporedni podatki
Delo na novem jeziku se je začelo s pripravo naborov podatkov. Na nadzorni plošči je veliko vnaprej določenih naborov podatkov iz odprtih virov, kot so Wikipedia, Evropski parlament, Paracrawl, Tatoeba in drugi. Za doseganje povprečne kakovosti prevoda zadostuje 5M prevedenih vrstic.

Slovar in Nastavitev tokenizerja
Nabori podatkov so vrstice besedila, prevedene iz enega jezika v drugega. Nato tokenizer besedilo razdeli na žetone in iz njih ustvari slovarje, razvrščene po pogostosti srečanja z žetonom. Žeton je lahko bodisi posamezni znak, zlog ali cele besede. Z Lingvanex Data Studio lahko nadzorujete celoten proces ustvarjanja slovarjev žetonov SentencePiece za vsak jezik posebej.

Filtriranje podatkov in Ocena kakovosti
Na voljo je več kot 20 filtrov za filtriranje vzporednih in enojezičnih korpusov, da pridobite kakovosten nabor podatkov iz odprtokodnih ali razčlenjenih podatkov. Označite lahko imenovane entitete, številke in druge žetone, da usposobite sistem, da pusti nekatere besede neprevedene ali prevedene na določen način.

Kontaktirajte nas zdaj
In pridobite brezplačen dostop do naših rešitev!