Ai auzit vreodată de AWS? Nu, nu e vorba de Asociația de Wrestling din Sibiu, ci de Amazon Web Services, o firmă care se ocupă cu inteligența artificială și alte chestii de ăstea. Ei bine, niște cercetători de la AWS au descoperit ceva șocant: internetul e plin de texte traduse prost în tot felul de limbi, fără nicio logică sau sens. Și nu vorbim de texte de pe bloguri obscure sau de pe site-uri de știri dubioase, ci de texte de pe site-uri mari și cunoscute, care ar trebui să fie de încredere.
Cum se face asta? Simplu: se folosesc niște modele lingvistice de mari dimensiuni (LLM), care sunt niște programe care învață să traducă texte dintr-o limbă în alta, fără să țină cont de context, gramatică, cultură sau orice altceva. Și cum nu au suficiente date de calitate pentru a învăța, rezultatul e o catastrofă. Cercetătorii au analizat peste 6 miliarde de propoziții și au constatat că peste 57% dintre ele au fost traduse în două sau mai multe limbi, și nu oricum, ci prost de tot. De exemplu, o propoziție din engleză a fost tradusă în franceză, apoi în xhosa, apoi în volof, și apoi iar în engleză, și a ieșit ceva de genul: “The cat is on the table” -> “Le chat est sur la table” -> “Ikati iphezulu kwetafile” -> “Mucii yaa fo ngay ndey” -> “The cows are for my mother”. Și asta e doar un exemplu, că sunt multe altele și mai nasoale.
Și care e problema?
Păi, problema e că internetul devine o sursă tot mai nesigură și inutilă de informație, mai ales pentru limbile care nu sunt atât de răspândite sau populare. Dacă vrei să afli ceva despre Africa sau despre Sudul Global, ai șanse mari să dai de texte traduse automat, care nu au nicio legătură cu realitatea. Și nu numai că nu înveți nimic, dar riști să te încurci și mai rău, pentru că modelele astea de traducere pot să inventeze lucruri care nu există, să schimbe sensul cuvintelor sau să omită informații importante. Și asta nu e bine, pentru că internetul ar trebui să fie un spațiu deschis și accesibil pentru toți, nu doar pentru cei care vorbesc engleză, germană sau japoneză.
Ce putem face?
Păi, putem să fim mai atenți la ce citim și să verificăm sursele și credibilitatea textelor. Putem să folosim traduceri profesionale sau de încredere, nu doar cele automate. Putem să contribuim la crearea de conținut de calitate în limbile noastre, pentru a oferi mai multe date și resurse pentru modelele lingvistice. Și putem să ne educăm și să ne informăm despre inteligența artificială și despre impactul ei asupra internetului și a societății. Altfel, riscăm să transformăm internetul într-o groapă de gunoi, unde nu mai găsim nimic valoros sau adevărat. Și tu, ce părere ai? Crezi că internetul e deja un gunoi tradus automat sau mai are o șansă să se salveze? Scrie-mi în comentarii și hai să discutăm.


Urmărește-ne și pe Google News