İstənilən domen və biznes tapşırığı üçün öz maşın tərcümə sisteminizi yaradın
Maşın tərcümə alətləri
Məlumatların hazırlanması
Paralel və birdilli korpusların təhlili, süzülməsi, işarələnməsi. Test və doğrulama məlumatları üçün blokların yaradılması
Creation of blocks for testing and verification data
Paralel iş siyahıları, GPU analitikası və keyfiyyət qiymətləndirmələri ilə xüsusi sinir arxitekturasını öyrədin
Yerləşdirmə
Model təlimi başa çatdıqda, o, avtomatik olaraq API kimi yerləşdirilə və ya oflayn istifadə üçün endirilə bilər
Başlanğıcdan mütəxəssisə qədər
Dashboard, proqram təminatını müştəri domenlərinə uyğunlaşdırmaq və tərcümə keyfiyyətini artırmaq üçün istifadə olunan ən son dil və statistik metodları birləşdirir. Aşağıdakı şəkildə: sağda modellərin öyrədildiyi tapşırıqların və GPU serverlərinin siyahısı verilmişdir. Mərkəzdə sinir şəbəkəsi parametrləri və aşağıda təlim üçün istifadə ediləcək məlumat dəstləri verilmişdir.

Paralel məlumatlarla işləmək
Yeni dil üzərində iş məlumat dəstlərinin hazırlanması ilə başladı. Tablosunda Vikipediya, Avropa Parlamenti, Tacrabl, Tatoeba və başqaları kimi açıq mənbələrdən əvvəlcədən təyin edilmiş bir çox məlumat dəsti var. Orta tərcümə keyfiyyətinə nail olmaq üçün 5 milyon tərcümə edilmiş sətir kifayətdir.

Lüğət və tokenizatorun qurulması
Məlumat dəstləri bir dildən digərinə tərcümə edilmiş mətn sətirləridir. Tokenizer daha sonra mətni işarələrə ayırır və onlardan nişanın baş vermə tezliyinə görə sıralanmış lüğətlər yaradır. Marker həm fərdi simvollar, həm də hecalar və ya bütün sözlər ola bilər. Linguanext Data Studio ilə hər bir dil üçün cümlə fraqmentlərinin marker lüğətlərinin yaradılması prosesini ayrı-ayrılıqda idarə edə bilərsiniz.

Məlumatların süzülməsi və keyfiyyətin qiymətləndirilməsi
Açıq mənbələrdən və ya təhlil edilmiş məlumatlardan keyfiyyətli bir məlumat dəsti əldə etmək üçün paralel və birdilli halları süzmək üçün 20-dən çox filtr mövcuddur. Sistemi bəzi sözləri tərcümə olunmamış və ya müəyyən bir şəkildə tərcümə etməyi öyrətmək üçün adlandırılmış obyektləri, rəqəmləri və digər əlamətləri qeyd edə bilərsiniz.
