Nulla di quanto ho detto in merito al traduttore automatico, anche nella seconda parte, deve far credere che il mio approccio nei confronti del traduttore automatico sia in qualche modo pregiudiziale. Vorrei anzi approfondire il punto del machine learning, ovvero di come si insegna a una macchina a imparare sentendo parlare un linguaggio naturale. Insomma, come si insegna a una macchina a diventare più “umana” e ad attuare miglioramenti che le consentano di rendere strumentali le conoscenze che acquisisce.
La linguistica computazionale
Tutto nasce alla fine degli anni ’50 con la linguistica computazionale.
I linguisti computazionali, semplicemente, come tutti i linguisti studiano grandi corpora di dati e da essi traggono delle conclusioni scientifiche sulla lingua che parliamo.
Studiare un corpus richiede un grande ammontare di tempo, richiede personale qualificato per “spulciare” il materiale che serve, per capire ad esempio quando un’occorrenza verbale sia rilevante oppure no. Ad esempio, quanti italiani dicono “a me mi” nel loro linguaggio scritto quotidiano? Il gruppo di persone che sfogliano il corpus è sostituito in quasi ogni tipo di linguistica oggi da una macchina, che sulla base di semplici istruzioni sintattiche e morfologiche, trova i dati grezzi, che vengono poi interpretati dai linguisti.
La linguistica computazionale va oltre.
Riconoscere la lingua parlata
La linguistica computazionale, attraverso il “tagging”, ovvero l’etichettatura computerizzata delle parti del discorso e della fonematica di un linguaggio naturale, porta ad esempio alle App di riconoscimento della lingua parlata.
Ormai il mio telefono interagisce con me e ascolta le ricerche che gli chiedo di fare come non avrei mai immaginato che si potesse fare.
Dagli anni ’50
Quello che secondo me questa esperienza insegna in modo molto icastico è come la tecnologia e l’interesse del mercato portino un campo della ricerca a impennare vertiginosamente verso realizzazioni pratiche impressionanti. Tornando ai traduttori automatici, vorrei fare una seconda considerazione: l’annullamento della barriera linguistica dato dalla diffusione delle “lingue franche” per i mercati (inglese per l’Europa e le Americhe, cinese e arabo che si spartiscono l’Asia), porta da un altro lato a un rispetto della differenziazione che i traduttori automatici consentono: non ti parlo in esperanto se DeepL mi traduce dal polacco all’italiano in pochi secondi. Così i polacchi continueranno a parlare il polacco, gli italiani l’italiano.