Evoluţie spectaculoasă a traducerii automate

0

Combinarea regulilor şi a unui instrument statistic pare calea cea mai bună pentru îmbunătăţirea traducerii automate, dar echilibrul între cele două abordări este greu de realizat. Pentru motorul de căutare hibrid Systran, de exemplu, au fost necesari 5 ani de cercetări.

De asemenea, trebuie luată în considerare diversitatea limbilor: în funcţie de structura limbii sursă şi de cea a limbii ţintă, abordarea prin reguli, de exemplu, va fi mai mult sau mai puţin eficientă, notează ziarul Le Monde.
‘În acest an, ne-am hotărât să ne concentrăm asupra îmbunătăţirii calităţii serviciului nostru de traducere automată’, afirmă Alfred Spector, vice-preşedinte al Departamentului de Cercetare şi Iniţiative Speciale al Google. Dificultăţile subtile ale traducerii automate pot fi rezolvate în scurt timp.

‘Abordarea noastră constă în ‘inteligenţa hibridă’, combinarea informaticii cu contribuţia umană, datorită sugestiilor utilizatorilor noştri’, potrivit acestuia. Serviciul trebuie să ia în considerare două dificultăţi principale. Mai întâi, este un instrument general, care trebuie să se adapteze la toate tipurile de texte, fie că este vorba de documente tehnice sau de articole de ziar sau texte literare.

‘Este o poziţionare ambiţioasă’, afirmă Marie Candito, conferenţiar lingvist la Universitatea Paris-VII şi specializată în prelucrarea automată a limbilor. ‘Întreprinderile specializate în traducere lucrează toate în domenii elaborate pe baza documentelor clienţilor lor.
Acest lucru le permite, în primul rând, să reducă în mod semnificativ polisemia.’ Într-un context juridic, de exemplu, sensul cuvântului ‘avocať nu va fi acelaşi ca în contextul culinar (fructul avocado).

Altă provocare pentru motorul de căutare este faptul că modelul de traducere, care este bazat pe statistici, permite obţinerea de fraze care sună bine în limba ţintă, dar cu un risc mai mare de interpretare greşită. Există două abordări principale pentru traducerea automată.
Din punct de vedere istoric, instrumentele de traducere automată funcţionează pe bază de reguli: maşinile ‘învaţă’ regulile de sintaxă, de gramatică, şi le aplică textului în momentul traducerii.

Google se bazează pe o altă abordare, mai recentă, care funcţionează prin analogie statistică. Metoda constă în compararea unor serii importante de texte în două limbi, de exemplu documentele publicate de Uniunea Europeană, şi deduce reguli de traducere. ‘Cu cât avem mai multe date de comparat, cu atât va fi rezultatul mai bun’, explică Alfred Spector.

Abordarea statistică are un avantaj major: ea duce la fraze mai coerente, care par mai naturale pentru că seamănă cu fraze elaborate de oameni. Dar nu are precizia abordării prin reguli. ‘Dacă luaţi, de exemplu, două fraze în engleză, absolut identice, dar într-un caz, cu verbul la prezent, şi în celălalt caz cu verbul la viitor, diferenţa de sens este majoră.
Dar pentru un motor statistic, diferenţa între cele două fraze este minimă şi cel mai adesea va traduce cele două fraze în acelaşi feľ, explică Pierre Bernassau, director de marketing la Systran, tehnologie de avangardă în traducerea bazată pe reguli.

Cele două abordări sunt departe de a fi incompatibile. Systran şi-a îmbogăţit, de altfel, anul trecut sistemul prin reguli cu un sistem bazat pe statistici, ca să ajungă la un motor hibrid. ‘Acum câţiva ani, nivelul de calitate al traducerilor noastre nu era suficient de ridicat ca să-i intereseze pe traducătorii profesionişti; numai traducerea prin reguli dă naştere la variante precise, dar foarte literale.

Acum, suntem solicitaţi de firme de traduceri pentru care programele noastre devin instrumente suficient de eficiente care le ajută să câştige timp’, adaugă Pierre Bernassau. Google vizează, de asemenea, o dublă abordare. ‘Trebuie să introducem mai multă sintaxă’, precizează Alfred Spector.

Dar serviciul se bazează mai ales pe imensa bază de utilizatori ca să-şi îmbunătăţească traducerile automate. De mai multe săptămâni, el a pus la baza utilizatorilor un instrument prin care aceştia să ofere sugestii pentru o traducere mai bună. Evoluţia spre o mai bună calitate se va face gradual, în parte din cauza modelului ales de Google.

‘Sistemele bazate pe reguli sunt destul de greu de aplicat, dar au avantajul că sunt uşor de modificat, prin adăugarea sau suprimarea de reguli. În abordarea statistică, aşa cum este aplicată de Google, editorul poate acţiona mai puţin asupra sistemului’, adaugă Marie Candito. Pentru aceasta, contribuţia internauţilor poate avea o oarecare utilitate, dar în cel mai bun caz va fi minoră.

Citește și

Spune ce crezi

Adresa de email nu va fi publicata

Acest sit folosește Akismet pentru a reduce spamul. Află cum sunt procesate datele comentariilor tale.