Арзёбии аҳамияти оморӣ дар системаи тарҷума

Дар арзёбии сифати тарҷумаи мошинӣ, на танҳо муқоиса кардани натиҷаҳои системаҳои гуногуни тарҷума, балки инчунин тафтиш кардан муҳим аст, ки оё фарқиятҳои пайдошуда аз ҷиҳати оморӣ муҳиманд. Ин ба мо имкон медиҳад, ки баҳо диҳем, ки оё натиҷаҳои бадастомада дурустанд ва онҳоро ба маълумоти дигар умумӣ кардан мумкин аст.

Дар ин мақола, мо ду нишондиҳандаи маъмултаринро барои арзёбии сифати тарҷума, BLEU ва COMET баррасӣ мекунем ва таҳлил мекунем, ки чӣ гуна аҳамияти омории фарқиятҳои байни ду системаи тарҷумаро бо истифода аз ин ченакҳо санҷед.

Аҳамияти омории BLEU ва COMET

Метрикаи BLEU (Таҳқиқоти арзёбии дузабона) сифати тарҷумаро тавассути муқоисаи n-граммаҳои матни тарҷумашуда бо n-граммаҳо дар тарҷумаи истинод (инсонӣ) арзёбӣ мекунад. Мувофиқи тадқиқоти “Бале, ба мо санҷиши аҳамияти оморӣ лозим аст, барои даъвои беҳбудии аз ҷиҳати оморӣ назаррас дар метрикаи BLEU нисбат ба кори қаблӣ, фарқият бояд аз 1.0 BLEU зиёдтар бошад. Агар мо такмили “-и хеле назаррасро ҳамчун ” p-арзиши “0.001< баррасӣ кунем, такмил бояд 2.0 нуқтаи BLEU ё бештар бошад.

Боз як метрикаи васеъ истифодашаванда, COMET (Метрики оптимизатсияшудаи кросслингвалӣ барои арзёбии тарҷума) модели омӯзиши мошинро барои арзёбии сифати тарҷума дар муқоиса бо тарҷумаи истинод истифода мебарад. Таҳқиқот нишон дод, ки фарқияти аз 1 то 4 хол метавонад аз ҷиҳати оморӣ ночиз бошад, яъне дар доираи хатогӣ. Ҳатто фарқияти холҳои 4.0 COMET метавонад ночиз бошад.

Ин натиҷаҳо барои таҳиягарони системаҳои тарҷумаи мошинӣ таъсири муҳими амалӣ доранд. Танҳо муқоисаи ченакҳои ададӣ метавонад ба хулосаҳои бардурӯғ дар бораи беҳтар шудани сифати тарҷума оварда расонад. Ба ҷои ин, санҷишҳои оморӣ бояд барои муайян кардани он, ки фарқиятҳои мушоҳидашуда воқеан маъно доранд ё не.

Интихоби метрик барои муқоисаи системаҳои тарҷума

Дар мақолаи “Ба киштӣ ё на ба киштӣ: Арзёбии васеъи метрикаи автоматӣ барои тарҷумаи мошин, муҳаққиқон аз Microsoft таҳқиқ карданд, ки кадом метрика барои арзёбии сифати тарҷумаи мошин бо арзёбии тарҷумонҳои касбӣ беҳтар алоқаманд аст. Барои ин онхо тачрибаи зеринро гузаронданд.

Тарҷумонҳои касбӣ, ки забони мавриди ҳадафро хуб медонанд, аввал матнро бидуни таҳрири баъдӣ дастӣ тарҷума карданд ва сипас тарҷумони мустақил сифати ин тарҷумаҳоро тасдиқ кард. Тарҷумонҳо контекстро аз ҷумлаҳои дигар диданд, вале ҷумлаҳоро алоҳида тарҷума карданд.

Тибқи натиҷаҳои ин таҳқиқот, метрикаи COMET, ки тарҷумаро дар асоси варианти истинод арзёбӣ мекунад, дар муқоиса бо арзёбии тарҷумонҳои касбӣ таносуб ва дақиқии баландтаринро нишон дод.

Муаллифони мақола инчунин омӯхтаанд, ки кадом метрик ҳангоми муқоисаи сифати системаҳои гуногуни тарҷумаи мошинӣ дақиқии баландтарин медиҳад. Тибқи бозёфтҳои онҳо, COMET дақиқтарин ченак барои муқоисаи системаҳои тарҷума бо ҳамдигар мебошад.

Барои санҷидани аҳамияти омории фарқиятҳои байни натиҷаҳо, муаллифон равишеро, ки дар мақолаи “Санҷишҳои аҳамияти оморӣ барои арзёбии тарҷумаи мошин тавсиф шудаанд, истифода бурданд.

Маълум аст, ки метрикаи COMET воситаи боэътимодтарин барои арзёбии сифати тарҷумаи мошинӣ ҳам ҳангоми муқоисаи он бо тарҷумаи инсон ва ҳам ҳангоми муқоисаи системаҳои гуногуни тарҷума бо ҳамдигар мебошад. Хулоса барои таҳиягарони системаҳои тарҷумаи мошинӣ муҳим аст, ки бояд кори моделҳои худро объективӣ арзёбӣ ва муқоиса кунанд.

Санҷиши аҳамияти оморӣ

Боварӣ ҳосил кардан муҳим аст, ки фарқиятҳои мушоҳидашуда байни системаҳои тарҷума аз ҷиҳати оморӣ муҳиманд, яъне бо эҳтимолияти баланди он, ки онҳо натиҷаи омилҳои тасодуфӣ нестанд. Бо ин мақсад, Филипп Коен пешниҳод мекунад, ки усули bootstrap дар худ истифода шавад моддаи “Санҷишҳои аҳамияти оморӣ барои арзёбии тарҷумаи мошинІН.

Усули аз нав намунагирии bootstrap як тартиби оморӣ мебошад, ки ба интихоб бо ивазкунӣ барои муайян кардани дақиқии (ғаразнок) баҳодиҳии намунавии дисперсия, миёна, инҳирофи стандартӣ, фосилаҳои эътимод ва дигар хусусиятҳои сохтории интихоб асос ёфтааст. Аз ҷиҳати схемавӣ, усули пурборкуниро метавон ба таври зерин муаррифӣ кард:

Алгоритм барои санҷиши аҳамияти оморӣ:

1. Намунаи пурборкунандаи ҳамон андоза аз намунаи аслӣ ба таври тасодуфӣ тавлид мешавад, ки дар он баъзе мушоҳидаҳо метавонанд якчанд маротиба гирифта шаванд ва дигарон умуман гирифта намешаванд.
2. Барои ҳар як намунаи bootstrap, арзиши миёнаи метрика (масалан, BLEU ё COMET) ҳисоб карда мешавад.
3. Тартиби интихоби пурборкунӣ ва ҳисоб кардани ҳисоби миёна борҳо (даҳҳо, садҳо ё ҳазорҳо) такрор карда мешавад.
4. Аз маҷмӯи миёнаи ба даст овардашуда, миёнаи умумӣ ҳисоб карда мешавад, ки миёнаи тамоми интихоб ҳисобида мешавад.
5. Фарқи байни арзишҳои миёна барои системаҳои муқоисашуда ҳисоб карда мешавад.
6. Барои фарқияти байни миёна фосилаи эътимод сохта мешавад.
7. Меъёрҳои оморӣ барои муайян кардани он, ки оё фосилаи эътимод барои фарқияти миёна аз ҷиҳати оморӣ муҳим аст, истифода мешавад.

Аризаи амалӣ

Равиши дар боло тавсифшуда барои метрикаи COMET дар китобхонаи Unbabel/COMET амалӣ карда мешавад, ки он ба ғайр аз ҳисоб кардани метрикаи COMET, инчунин қобилияти санҷиши аҳамияти омории натиҷаҳои бадастомадаро фароҳам меорад. Ин равиш як қадами муҳим дар самти арзёбии боэътимод ва дурусти системаҳои тарҷумаи мошин мебошад. Танҳо муқоисаи ченакҳо метавонад аксар вақт гумроҳкунанда бошад, хусусан вақте ки фарқиятҳо хурданд.

Татбиқи усулҳои таҳлили оморӣ, ба монанди bootstrap, як қадами муҳим дар баҳодиҳии объективӣ ва муқоисаи кори системаҳои тарҷумаи мошинӣ мебошад. Ин ба таҳиягарон имкон медиҳад, ки ҳангоми интихоби равишҳо ва моделҳои оптималӣ қарорҳои огоҳона қабул кунанд ва ба корбарон пешниҳоди боэътимоди натиҷаҳоро таъмин кунанд.

Хулоса

Ҳамин тариқ, ҳангоми муқоисаи системаҳои тарҷумаи мошинӣ, истифодаи усулҳои оморӣ барои ҷудо кардани беҳбудиҳои пурмазмун аз омилҳои тасодуфӣ муҳим аст. Ин ба пешрафти технологияи тарҷумаи мошинӣ баҳодиҳии объективӣ медиҳад.


Саволҳои зуд-зуд пурсидашуда (FAQ)

Тарҷумаи арзёбии метрикӣ чист?

Тарҷумаи арзёбии метрӣ як усули арзёбии сифати натиҷаҳои тарҷумаи мошин мебошад. Он муқоисаи натиҷаи системаи тарҷумаи мошинро бо тарҷумаи истинод ба инсон ва ҳисоб кардани холҳои ададӣ, ки шабоҳати байни ин дуро инъикос мекунад, дар бар мегирад.

Дар тарҷумаи мошинӣ аҳамияти оморӣ чист?

Аҳамияти оморӣ дар тарҷумаи мошинӣ ба истифодаи усулҳои оморӣ барои муайян кардани он, ки оё фарқиятҳо дар иҷрои байни ду ё зиёда системаҳои тарҷумаи мошинӣ ба қадри кофӣ калонанд, ки на танҳо аз сабаби тасодуфи тасодуфӣ, балки пурмазмун ҳисобида шаванд.

Сифати тарҷумаи мошинро чӣ гуна арзёбӣ кардан мумкин аст?

Барои арзёбии сифати тарҷумаи мошинӣ, усулҳои маъмул баҳодиҳии инсонӣ ва ченакҳои баҳодиҳии автоматӣ, аз қабили BLEU, COMET, METEOR, TER ва ғайраро дар бар мегиранд, ки натиҷаи тарҷумаи мошинро бо як ё якчанд тарҷумаҳои истинод ба инсон муқоиса мекунанд. Интихоби усули арзёбӣ аз ҳадафҳо ва талаботи мушаххаси вазифаи тарҷума вобаста аст.

Методологияи маъмултарин барои ченакҳои автоматии сифати тарҷума кадом аст?

Методологияи маъмултарин барои ченакҳои автоматии сифати тарҷума ба муқоисаи n-gram асос ёфтааст. Ин ченакҳои арзёбии тарҷумаи мошинӣ, ба монанди BLEU, такрори байни n-граммаҳо (пайвандҳои калимаҳои n) дар матни тарҷумашудаи мошин ва n-граммҳоро дар як ё якчанд тарҷумаҳои истинод ба инсон ҳисоб мекунанд, ки такрори баландтар нишон медиҳад, ки сифати беҳтари тарҷума.

Се ҷанбаи арзёбии сифати тарҷума чист?

Се ҷанбаи асосии арзёбии сифати тарҷума инҳоянд: Маъно (дараҷае, ки маъно ва мазмуни матни аслӣ дар тарҷума дақиқ баён мешавад), Ифода (то чӣ андоза табиӣ, равон ва грамматикӣ дуруст будани забони матни тарҷумашуда), Хатогиҳо (шумора ва вазнинии ҳама гуна хатогиҳо, тарҷумаҳои нодуруст ё камбудиҳо дар тарҷума).

Хониши ҷолибтар интизор аст

Эътироф кардани сухан дар дохили бино чист?

Эътироф кардани сухан дар дохили бино чист?

September 19, 2024

Нишондиҳандаҳои омӯзиши амиқи gpu

Нишондиҳандаҳои омӯзиши амиқи gpu

September 10, 2024

Эътироф кардани нутқ дар маркетинг

Эътироф кардани нутқ дар маркетинг

August 23, 2024

Бо мо тамос гиред

0/250
* Майдони заруриро нишон медиҳад

Махфияти шумо барои мо аз ҳама муҳим аст; маълумоти шумо танҳо барои мақсадҳои тамос истифода мешавад.

Почтаи электронӣ

Ба итмом расид

Дархости шумо бомуваффақият фиристода шуд

× 
Customize Consent Preferences

We use cookies to help you navigate efficiently and perform certain functions. You will find detailed information about all cookies under each consent category below.

The cookies that are categorized as "Necessary" are stored on your browser as they are essential for enabling the basic functionalities of the site.

We also use third-party cookies that help us analyze how you use this website, store your preferences, and provide the content and advertisements that are relevant to you. These cookies will only be stored in your browser with your prior consent.

You can choose to enable or disable some or all of these cookies but disabling some of them may affect your browsing experience.

Always Active

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

No cookies to display.

Always Active

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

No cookies to display.

Always Active

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

No cookies to display.

Always Active

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

No cookies to display.

Always Active

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

No cookies to display.