Luo oma konekäännösjärjestelmä mille tahansa toimialueelle ja liiketoimintatehtävässä
Konekääntämisen Työkalupakki
Tietojen Valmistelu
Rinnakkaisten ja yksikielisten korpusten jäsentäminen, suodattaminen ja merkitseminen. Luo lohkoja testi- ja validointitietoja varten
Mallikoulutus
Kouluttaa räätälöityä neuraalista arkkitehtuuria rinnakkaisten tehtäväluetteloiden, GPU-analytiikan ja laadunarvioinnin avulla.
Käyttöönotto
Kun mallin koulutus on päättynyt, se voidaan ottaa automaattisesti käyttöön API:na tai ladata offline-käyttöä varten.
Aloittelijasta Asiantuntijaksi
Dashboard yhdistää viimeisimmät lingvistiset ja tilastolliset tekniikat, joita käytetään ohjelmiston kouluttamiseen asiakastoimialoille ja käännösten laadun parantamiseen. Alla olevassa kuvassa oikealla on luettelo tehtävistä ja GPU-palvelimista, joilla malleja koulutetaan. Keskellä ovat neuroverkon parametrit, ja alapuolella ovat harjoittelussa käytettävät tietokokonaisuudet.

Työskentele Rinnakkaiset Tiedot
Uuden kielen työstäminen alkoi tietokokonaisuuksien valmistelulla. Kojelaudassa on monia valmiita tietokokonaisuuksia avoimista lähteistä, kuten Wikipediasta, Euroopan parlamentista, Paracrawlista, Tatoebasta ja muista. Keskimääräisen käännöslaadun saavuttamiseksi riittää 5 miljoonaa käännettyä riviä.

Sanakirjan ja Tokenisaattorin Viritys
Tietoaineistot ovat tekstirivejä, jotka on käännetty kielestä toiseen. Sen jälkeen tokenizer jakaa tekstin merkkeihin ja luo niistä sanakirjoja, jotka lajitellaan merkin esiintymistiheyden mukaan. Merkki voi olla joko yksittäisiä merkkejä, tavuja tai kokonaisia sanoja. Lingvanex Tietostudio avulla voit hallita koko SentencePiece-merkkisanakirjojen luomisprosessia jokaiselle kielelle erikseen.

Tietojen Suodatus ja Laadunarviointi
Käytettävissä on yli 20 suodatinta rinnakkaisten ja yksikielisten korporaatioiden suodattamiseen, jotta avoimen lähdekoodin tai jäsennellyn datan pohjalta saadaan laadukas tietokokonaisuus. Voit merkitä nimettyjä entiteettejä, numeroita ja muita merkkejä kouluttaaksesi järjestelmän jättämään joitakin sanoja kääntämättä tai kääntämään ne tietyllä tavalla.
