Hozzon létre saját gépi fordítási rendszert bármilyen tartományhoz és üzleti feladathoz
Gépi fordítási eszközkészlet
Adatelőkészítés
Párhuzamos és egynyelvű korpuszok elemzése, szűrése, jelölése. Blokkok létrehozása tesztelési és validálási adatokhoz
Modellképzés
Egyedi neurális architektúra képzése párhuzamos feladatlistákkal, GPU analitikával és minőségbecsléssel
Telepítés
Amikor a modellképzés befejeződik, a modell automatikusan telepíthető API-ként vagy letölthető offline használatra.
A kezdőtől a szakértőig
A Dashboard a legújabb nyelvészeti és statisztikai technikákat ötvözi, amelyek segítségével a szoftvert az ügyfélterületekhez képezzük, és javítjuk a fordítás minőségét. Az alábbi képen: jobbra a feladatok és a GPU-kiszolgálók listája, amelyeken a modellek betanítása folyik. Az alábbi képen: jobbra a feladatok és a GPU-kiszolgálók listája, amelyeken a modellek betanítása folyik.

Párhuzamos adatokkal való munka
Az új nyelven való munka az adatkészletek előkészítésével kezdődött. A műszerfal számos előre meghatározott adatkészletet tartalmaz olyan nyílt forrásokból, mint a Wikipedia, az Európai Parlament, a Paracrawl, a Tatoeba és mások. Egy átlagos fordítási minőség eléréséhez 5 millió lefordított sor elegendő.

Szótár és tokenizáló hangolása
Az adatkészletek az egyik nyelvről a másikra lefordított szövegsorok. Ezután a tokenizáló a szöveget tokenekre bontja, és ezekből szótárakat hoz létre, a tokenek előfordulási gyakorisága szerint rendezve. A tokenek lehetnek egyes karakterek, szótagok vagy egész szavak. A Lingvanex Data Studio segítségével a SentencePiece token szótárak létrehozásának teljes folyamatát minden nyelvre külön-külön vezérelheti.

Adatszűrés és minőségbecslés
Több mint 20 szűrő áll rendelkezésre a párhuzamos és egynyelvű korpuszok szűréséhez, hogy minőségi adathalmazt kapjunk az opensource vagy elemzett adatokból. Megnevezett entitásokat, számjegyeket és egyéb tokeneket jelölhet, hogy a rendszer egyes szavakat lefordítatlanul hagyjon vagy meghatározott módon fordítson.

Lépjen kapcsolatba velünk most
És kapjon ingyenes hozzáférést megoldásainkhoz!