Създайте своя собствена система за машинен превод за всеки домейн и бизнес задача
Инструментариум за машинен превод
Подготовка на данни
Анализирайте, филтрирайте, маркирайте паралелни и едноезични корпуси. Създайте блокове за тестови и валидиращи данни
Модел обучение
Обучете персонализирана невронна архитектура с паралелни списъци със задачи, GPU анализи и оценка на качеството
Разгръщане
Когато обучението на модела приключи, той може да бъде разгърнат автоматично като API или достъпен за изтегляне за офлайн употреба
От новак до Експерт
Dashboard съчетава най-новите лингвистични и статистически техники, които се използват за обучение на софтуера към потребителски домейни и подобряване на качеството на превода. На снимката по-долу: вдясно е списък със задачи и GPU сървъри, на които моделите се обучават. В центъра са параметрите на невронната мрежа, а отдолу са наборите от данни, които ще се използват за обучение.

Работи с Паралелни данни
Работата по нов език започна с подготовката на набори от данни. Таблото за управление има много предварително дефинирани набори от данни от отворени източници като Wikipedia, European Parliament, Paracrawl, Tatoeba и други. За да се постигне средно качество на превода, са достатъчни 5 милиона преведени реда.

Речник and Настройка на токенизатор
Наборите от данни са редове текст, преведени от един език на друг. След това токенизаторът разделя текста на токени и създава речници от тях, сортирани по честотата на срещане на токена. Токенът може да бъде или единични знаци, срички или цели думи. С Lingvanex Data Studio можете да контролирате целия процес на създаване на SentencePiece токен речници за всеки език поотделно.

Филтриране на данни и Оценка на качеството
Налични са повече от 20 филтъра за филтриране на паралелни и едноезични корпуси, за да получите качествен набор от данни от отворен код или анализирани данни. Можете да маркирате наименувани обекти, цифри и всякакви други символи, за да обучите системата да оставя някои думи непреведени или преведени по специфичен начин.

Свържете се с нас сега
И получете безплатен достъп до нашите решения!