Oħloq is-sistema tat-traduzzjoni tal-magni tiegħek stess għal kwalunkwe kompitu tad-dominju u n-negozju
Toolkit tat-Traduzzjoni Magni
Preparazzjoni tad-Data
Parse, iffiltra, markup paralleli u corpus monolingwi. Oħloq blokki għad-dejta tat-test u l-validazzjoni
Taħriġ Mudell
Ferrovija arkitettura newrali personalizzata b’listi ta’ xogħol paralleli, analiżi tal-GPU u stima tal-kwalità
Skjerament
Meta jintemm it-taħriġ tal-mudell jista’ jiġi skjerat awtomatikament bħala API jew disponibbli biex jitniżżel għall-użu offline
Minn Novice għal Espert
Dashboard jgħaqqad l-aħħar tekniki lingwistiċi u statistiċi li jintużaw biex iħarrġu s-softwer għall-dominji tal-klijenti u jtejbu l-kwalità tat-traduzzjoni. Fl-istampa hawn taħt: fuq il-lemin hemm lista ta ‘kompiti u servers tal-GPU li fuqhom qed jiġu mħarrġa mudelli. Fiċ-ċentru hemm il-parametri tan-netwerk newrali, u hawn taħt hemm is-settijiet tad-dejta li se jintużaw għat-taħriġ.

Xogħol b’Dejta Parallel
Il-ħidma fuq lingwa ġdida bdiet bil-preparazzjoni tas-settijiet tad-dejta. Id-dashboard għandu ħafna settijiet ta’ dejta predefiniti minn sorsi miftuħa bħall-Wikipedija, il-Parlament Ewropew, Paracrawl, Tatoeba u oħrajn. Biex tintlaħaq kwalità ta’ traduzzjoni medja, 5M linji tradotti huma biżżejjed.

Dizzjunarju u Tokenizer Tuning
Is-settijiet tad-dejta huma linji ta’ test tradotti minn lingwa għal oħra. Imbagħad it-tokenizer jaqsam it-test f’tokens u joħloq dizzjunarji minnhom, magħżula skont il-frekwenza tal-laqgħa mat-token. It-token jista’ jkun jew karattri singoli, sillabi, jew kliem sħaħ. Bil-Lingvanex Data Studio tista’ tikkontrolla l-proċess kollu tal-ħolqien ta’ dizzjunarji tat-token SentencePiece għal kull lingwa separatament.

Iffiltrar tad-Data u Stima tal-Kwalità
Aktar minn 20 filtru huma disponibbli biex jiffiltraw corpus paralleli u monolingwi biex jiksbu s-sett tad-dejta ta ‘kwalità minn dejta opensource jew parsed. Tista’ timmarka entitajiet imsemmija, ċifri u kwalunkwe tokens oħra biex tħarreġ is-sistema biex tħalli xi kliem mhux tradott jew tradott b’mod speċifiku.
