Sukurkite savo mašininio vertimo sistemą bet kuriai sričiai ir verslo užduočiai
Mašininio vertimo įrankių rinkinys
Duomenų paruošimas
Analizuokite, filtruokite, žymėkite lygiagrečius ir vienakalbius korpusus. Kurkite blokus testavimo ir patvirtinimo duomenims
Modelių mokymas
Mokykite tinkintą neuroninę architektūrą naudodami lygiagrečių darbų sąrašus, GPU analizę ir kokybės įvertinimą
Diegimas
Pasibaigus modelio mokymui, jis gali būti automatiškai įdiegtas kaip API arba atsisiųsti, kad būtų galima naudoti neprisijungus
Nuo naujoko iki eksperto
Informacijos suvestinė apjungia naujausius kalbinius ir statistinius metodus, kurie naudojami mokant programinę įrangą klientų srityse ir gerinant vertimo kokybę. Žemiau esančiame paveikslėlyje: dešinėje yra užduočių ir GPU serverių, kuriuose modeliai mokomi, sąrašas. Centre yra neuroninio tinklo parametrai, o žemiau pateikiami duomenų rinkiniai, kurie bus naudojami mokymui.

Darbas su Parallel Data
Darbas su nauja kalba prasidėjo ruošiant duomenų rinkinius. Prietaisų skydelyje yra daug iš anksto nustatytų duomenų rinkinių iš atvirų šaltinių, tokių kaip Vikipedija, Europos Parlamentas, Paracrawl, Tatoeba ir kt. Norint pasiekti vidutinę vertimo kokybę, pakanka 5 mln. išverstų eilučių.

Žodyno ir žetonų derinimas
Duomenų rinkiniai yra teksto eilutės, išverstos iš vienos kalbos į kitą. Tada žetonų priemonė suskaido tekstą į žetonus ir iš jų sukuria žodynus, surūšiuotus pagal žetono susitikimo dažnumą. Ženklas gali būti pavieniai simboliai, skiemenys arba ištisi žodžiai. Naudodami „Lingvanex Data Studio“ galite valdyti visą „SentencePiece“ žetonų žodynų kiekvienai kalbai kūrimo procesą atskirai.

Duomenų filtravimas ir kokybės įvertinimas
Yra daugiau nei 20 filtrų, skirtų filtruoti lygiagrečius ir vienakalbius korpusus, kad būtų galima gauti kokybės duomenų rinkinį iš atvirojo kodo arba analizuotų duomenų. Galite pažymėti pavadintus objektus, skaitmenis ir bet kokius kitus žetonus, kad išmokytumėte sistemą palikti kai kuriuos žodžius neišverstus arba išverstus tam tikru būdu.

Susisiekite su mumis dabar
Ir gaukite nemokamą prieigą prie mūsų sprendimų!