Cum functioneaza programul de traducere automata Google? De multe ori da rezultate absurde, dar ramane unul dintre instrumentele de comunicare cele mai incredibile din istoria omenirii... cu un enorm impact social.

Programul de traducere automata Google este diferit de toate celelalte. Bazat pe un software conceput in anii 80 de catre IBM, nu incearca sa gaseasca semnificatia unei expresii pornind de la sintaxa si de la vocabular. Mai mult decat atat: semnificatia nici macar nu il intereseaza. In loc de a considera o expresie lingvistica ca ceva de decodificat, o considera ca pe ceva ce, foarte probabil, a fost deja zisa. Si asa, utilizand enorma sa putere de calcul, lanseaza in reteaua sa de mare viteza cautarea acelei expresii in un text (carte, articol, subtitrari de filme, etc, etc) care sa aiba deja traducerea corespondenta.

In enorma cantitate de informatii aflate la dispozitia sa se afla toate documentele traduse in zeci de limbi de catre Uniunea Europeana incepand din 1957, tot ceea ce Onu si agentiile sala au scris in cele sase limbi oficiale si multe alte materiale, de la procesele verbale ale tribunalelor internationale pana la toate articolele si cartile de pe internet traduse in cel putin doua limbi. Folosindu-se de modele de corespondenta cunoscute intre aceste milioane de documente, traducatorul Google foloseste metode statistice pentru a alege versiunea probabil cea mai apropiata de traducerea corecta. Momentan traducerea este posibila intre 58 de limbi, deci 3.306 de incrucisari posibile.

Limbile "pivot"

Majoritatea acestor corespondente de traduceri - de la islandeza la araba, de la iudaica la vietnameza - constituie noua sa creatie: intre ele nu exista un trecut de traduceri, deci nu exista texte traduse asociate nici in internet si nici in alta parte. Traducatorul automat se foloseste de acelasi artificiu care dintotdeauna contribuie la comunicarea interculturala: limbile "pivot" sau "intermediare".

Asa cum era de asteptat, engleza este principala limba pivot. Cum pentru a calcula corespondenta cea mai probabila intre limbi care nu au fost niciodata traduse reciproc se folosesc metode statistice, trebuie utilizat un pivot capabil de a oferi corespondente atat cu limba de plecare cat si cu limba in care se doreste traducerea. Este posibil ca un numar semnificativ de, sa zicem, romane politiste in limba engleza sa fi fost traduse in limba islandeza sau araba. Aceste romane, deci, furnizeaza material abundent pentru a regasi corespondentele intre frazele in cele doua limbi, in timp ce clasicii persiani tradusi in islandeza sunt fara nici un dubiu mult mai putini.

Asta inseamna ca de exemplu John Grisham da o contributie mult mai mare pentru calitatea traducerilor Goggle din islandeza in romana decat vor putea vreodata contribui un clasic roman sau un clasic islandez. Poate ca adevarata magie din Harry Potter se regaseste in puterea lui ascunsa de a ajuta traducerile din bulgara in chineza!

Traducatorul automat se foloseste direct si de catre factorul uman, pentru ca cere intotdeauna utilizatorilor sa ii sugereze o traducere mai buna decat cea furnizata de catre el. Evident, produce si traduceri absurde, dar in general absurditatile unui traducator automat sunt mai putin periculoase decat cele produse de catre erorile umane. De obicei se observa imediat cand Google Translator greseste, pentru ca rezultatul nu are sens.

Daca se ramane legati de ideea ca o limba e compusa din cuvinte si reguli care au un relatie calculabila cu semnificatia lor, atunci traducatorul de la Google nu este de fapt un traducator automat, ci un simplu truc produs de un buldozer electronic caruia ii este permis sa fure munca altuia. Pentru cei care in schimb il judeca cu o mentalitate mai deschisa, inseamna cu totul altceva. Google Translator abordeaza traducerea plecand nu atat de la presupunerea ca fiecare fraza este diferita, ci mai ales de la opusul acesteia: a fost deja zisa candva.

Ignorand ceea ce reprezinta in teorie, practic limba este folosita mai ales pentru a zice acelasi lucruri la infinit: le repetam pentru ca ne lovim zilnic de aceleasi nevoi si avem aceleasi frici, aceleasi dorinte si aceleasi senzatii. Ideea de la baza traducatorului Google este de fapt o manifestare a umanitatii noastre comune.