Archives for posts with tag: traduttore automatico

Ma ecco che dopo aver constatato che le lingue franche potrebbero venire meno in seguito all’utilizzo del traduttore, vorrei per amore del ragionamento per assurdo sostenere esattamente l’opposto, nella migliore tradizione sofista.

Le lingue finte saranno le più tradotte

Prendiamo un contesto aziendale. Una multinazionale, diciamo, italiana commercia con l’estrema Asia. La domanda è molto semplice: con a portata di mano un ottimo traduttore, è più probabile che la lingua nella quale si decida di comunicare sia l’inglese/cinese o, diciamo, il coreano tradotto?

Posto che né si parlerà, in ogni caso, l’inglese britannico, né il cinese mandarino. Anche perché quest’ultima è una lingua estremamente complessa, e nella comunicazione di concetti logistici non è certo richiesta tutta, e in tute le sue sfumature. Queste due lingue “franche”, però, sono molto più semplici nella resa, mettendo in un traduttore un testo complesso dalla propria lingua madre. Pensiamo a cosa succederebbe, se inserissimo nel traduttore automatico una frase in italiano ineccepibile, e a scatola chiusa ci affidassimo a una macchina per consegnare al cliente coreano un’altrettanto complessa e articolata mail in coreano.

A me, hic et nunc, sembra quantomeno assurdo pensare a un grado di affidabilità simile, da parte di un traduttore. Ma poi, mi sembra anche assurdo che mai si svilupperà una simbiosi simile con questi mezzi, che consentono sì la comunicazione migliore, ma mi sentirei di dire che lo fanno più sulla traduzione in entrata.

La fiducia nel mezzo

Quello che pensavo di sostenere nella terza parte di questa piccola riflessione è che scrivere solo nella propria lingua, aspettandosi che un altro faccia il lavoro di traduzione, è in realtà una forma di preservazione della purezza della madrelingua. Che sarebbe credo cara a molti poeti dell’antichità, non c’è dubbio. Ma poi, quanta parte del manager aziendale si fiderebbe? Quanto siamo ancora dipendenti dal concetto di lingua franca? Come possiamo credere che un abito a noi così attillato come la lingua possa adattarsi a algoritmi, e consegnare lo stesso abito ad altri?

Io credo che le lingue franche siano quelle che sopravviveranno a qualsiasi evoluzione tecnologica. E con questo ho concluso.

Nulla di quanto ho detto in merito al traduttore automatico, anche nella seconda parte, deve far credere che il mio approccio nei confronti del traduttore automatico sia in qualche modo pregiudiziale. Vorrei anzi approfondire il punto del machine learning, ovvero di come si insegna a una macchina a imparare sentendo parlare un linguaggio naturale. Insomma, come si insegna a una macchina a diventare più “umana” e ad attuare miglioramenti che le consentano di rendere strumentali le conoscenze che acquisisce.

La linguistica computazionale

Tutto nasce alla fine degli anni ’50 con la linguistica computazionale.

I linguisti computazionali, semplicemente, come tutti i linguisti studiano grandi corpora di dati e da essi traggono delle conclusioni scientifiche sulla lingua che parliamo.

Studiare un corpus richiede un grande ammontare di tempo, richiede personale qualificato per “spulciare” il materiale che serve, per capire ad esempio quando un’occorrenza verbale sia rilevante oppure no. Ad esempio, quanti italiani dicono “a me mi” nel loro linguaggio scritto quotidiano? Il gruppo di persone che sfogliano il corpus è sostituito in quasi ogni tipo di  linguistica oggi da una macchina, che sulla base di semplici istruzioni sintattiche e morfologiche, trova i dati grezzi, che vengono poi interpretati dai linguisti.

La linguistica computazionale va oltre.

Riconoscere la lingua parlata

La linguistica computazionale, attraverso il “tagging”, ovvero l’etichettatura computerizzata delle parti del discorso e della fonematica di un linguaggio naturale, porta ad esempio alle App di riconoscimento della lingua parlata.

Ormai il mio telefono interagisce con me e ascolta le ricerche che gli chiedo di fare come non avrei mai immaginato che si potesse fare.

Dagli anni ’50

Quello che secondo me questa esperienza insegna in modo molto icastico è come la tecnologia e l’interesse del mercato portino un campo della ricerca a impennare vertiginosamente verso realizzazioni pratiche impressionanti. Tornando ai traduttori automatici, vorrei fare una seconda considerazione: l’annullamento della barriera linguistica dato dalla diffusione delle “lingue franche” per i mercati (inglese per l’Europa e le Americhe, cinese e arabo che si spartiscono l’Asia), porta da un altro lato a un rispetto della differenziazione che i traduttori automatici consentono: non ti parlo in esperanto se DeepL mi traduce dal polacco all’italiano in pochi secondi. Così i polacchi continueranno a parlare il polacco, gli italiani l’italiano.

L’utilizzo del traduttore automatico è una frontiera.

Una frontiera tra l’esattezza lessicale che viene richiesta dal buon traduttore nelle scuole di linguistica odierne, e dall’altro lato la necessaria contestualizzazione del materiale tradotto.

Traduttore automatico

E’ evidente che tra le due sia più difficile raggiungere la seconda, per un traduttore automatico. Per quanto riguarda la prima, le regole grammaticali impostate dai programmatori come ferree consentiranno un minore margine di errore. Va detto che la varietà che la mente di un traduttore consente, e tutte le sfumature di un termine, di un’immagine, forse non saranno immagazzinate in quella macchina specifica. Però vorrei dire che quando lessi alcune poesie di Baudelaire, masticando un po’ meglio il francese di quanto io faccia ora, mi trovai in disaccordo con alcune delle traduzioni proposte.

Traditore

Il traduttore traditore è una figura che di per sé ricompare in alcuni ambienti nella storia della letteratura. Tradire è già passare da una lingua a un’altra, perché il retaggio culturale e regionale che un autore imprime al proprio testo sono variabili. Variabile è anche e già la percezione che un lettore se ne fa, a seconda della propria percezione linguistica.

Certo, non vogliamo sfociare nel relativismo più scevro, ma per capirci, qualche problema con la traduzione c’è sempre stato, ed è sempre stato percepito. Ma come si insegna, dunqeu, questo contesto alle macchine?

Il contesto spiegato alle macchine

Il contesto in cui calare un sintagma è inserito grazie a processi di machine learning nella cui complessità non saprei addentrarmi. Quel poco che mi pare di aver capito è che alla macchina viene insegnato “come imparare”. ovvero, le viene sottoposta una quantità di dati sempre variabili, e quello che dovrà apprendere sarà come scremare le casistiche.

Quello che fanno “manualmente” i linguisti che studiano un corpus, la macchina lo eseguirà grazie alla propria abilità di calcolo.

Nella prossima puntata vedremo meglio quest’ultimo punto.

 

Che ci sia un genuino desiderio d’inchiesta dietro chi utilizza il traduttore automatico, è fuor di dubbio.

Traduttore automatico e “Dire quasi la stessa cosa”

Il traduttore automatico sembra essere oggetto di sempre più attenzioni da parte degli internauti. E’ evidente che un Salinger non potrà essere affidato alle larghe maglie di Google Translate, come anche una nota medica. Comunque, l’importanza del documento che si desidera tradurre è direttamente proporzionale al desiderio d’inchiesta: cosa c’è scritto? Ma inversamente, ahimé, all’opportunità di utilizzare un traduttore automatico.

“Dire quasi la stessa cosa” è un saggio del 2003 di Umberto Eco. Iniziava appunto con una rassegna molto divertente di alcuni esperimenti falliti con i traduttori automatici all’epoca in circolazione. Mi rende un po’ perplesso pensare che 15 anni fa fosse già quasi un’era diversa, però dimostrerò come le cose non sono poi tanto cambiate.

DeepL

Ho sentito molto parlare di DeepL, il traduttore che dovrebbe fare da diretto concorrente a Google. La traduzione cerca di basarsi sui processi neurali che l’uomo compie per comprendere e articolare il linguaggio, con l’ambizione di universalizzare la semantica e le scienze cognitive umane. Questa è la traduzione di questo primo paragrafo, inserito in DeepL:

“I’ve heard a lot about DeepL, the translator who should be the direct competitor to Google. The translation tries to be based on the neural processes that man performs to understand and articulate language, with the ambition to universalize semantics and human cognitive sciences. This is the translation of this first paragraph, inserted in DeepL”.

L’inchiesta sul significato

Cosa ne penso? Trovo che sia una buona traduzione. Il senso tecnico del mio paragrafo, scritto in un italiano piuttosto ordinario, è stato rispettato. Per la nota di un medico forse può andar bene, anche se ho fatto altri esperimenti con la poesia, e non sono stato così fortunato.

Ma la mia curiosità, che risponde a un naturale bisogno umano, non si è fermata. Ho pensato a un poeta che rispetta la semantica della prosa, che rispetta la metrica. Ci ho messo anche un’apostrofe, e ecco qui la traduzione dell’ultimo paragrafo di “Pianto Antico” di Carducci:

“Thou art of my plant
Beaten and withered,
You of the useless life
Extreme unique flor,
Six in the cold land,
Thou art in the black land;
Nor the sun most rejoices thee
nor does it awaken your love”.

Devo dire che sono colpito.