Per vari motivi ho da sempre approfondito il tema del web marketing internazionale e traduzioni e tutto quello che la localizzazione dei contenuti mi ha sempre affascinato.
Non sono un esperto di reti neurali né di machine learning ma so, più o meno come funzionano, e so anche che potrebbero diventare pericolose: per eliminare lo spam potrebbero, se ne avessero la possibilità, arrivare a determinare che, come estremo rimedio, l’eliminazione dell’intera umanità risolverebbe il problema.
Il mondo delle reti neurali e del machine learning si avvicina però a quello del web marketing internazionale e traduzioni: come?
Alla fine del 2016 Google ha pubblicato un articolo, che ha avuto scarsa risonanza mediatica, nel quale annuncia alcuni risultati inerenti il nuovo sistema di traduzione multilingue basato su machine learning e reti neurali che ha iniziato a impiegare (con evidenti miglioramenti qualitativi) in Google Translate a partire da settembre 2016: Zero Shot Translation.
Fino a settembre, infatti, Google Translate utilizzava la traduzione basata su frasi ovvero partiva da una serie di frasi tradotte e le impiegava per dire una cosa in una lingua partendo da un’altra.
Un po’ come facciamo noi umani quando in aereo leggiamo una guida sul Giappone e cerchiamo di memorizzare frasi come “Dove si trova un ristorante?“, “Buongiorno posso avere un caffè?” senza dovercele creare da zero e impazzire cercando le singole parole nelle pagine di un dizionario.
Quello che ho sempre sconsigliato di fare anche nel mio libro Web Marketing Internazionale nel quale sostengo a più riprese che non serve la traduzione ma è fondamentale la localizzazione dei contenuti, della comunicazione e dei messaggi.
Le traduzioni basate su frase sono dunque uno strumento rapido, veloce, abbastanza efficace ma non del tutto, né quasi mai, efficiente in quanto la mappatura di frasi e parole senza capirne il contesto né la struttura linguistica origina delle traduzioni spesso insensate o comunque non pertinenti con il pubblico di riferimento.
“Luoghi che il libro marcò” potrebbe essere una traduzione di “Bookmarked sites“, ad esempio.
Questo approccio, inoltre, è limitato dalle dimensioni del frasario e del vocabolario utilizzato e, soprattutto, non è in grado né di imparare e né tantomeno di migliorarsi con l’utilizzo poiché una parola sconosciuta resta tale finché qualcuno non la “mappa” all’interno della lista dei termini conosciuti.
Queste inefficienze e questi limiti hanno indotto Google a impiegare un nuovo motore di traduzione denominato Google Neural Machine Translation system (GNMT) che si basa su reti neurali e machine learning e che quindi mira a stravolgere la modalità di traduzione.
In primo luogo Google ha capito che una delle risorse più importanti di cui dispone è la quantità enorme e in continua evoluzione di richieste di traduzione tramite Google Translate: se ogni giorno Google rileva che 20% delle query di ricerca sono completamente nuove, c’è da pensare che un fenomeno simile si registri anche per le richieste di traduzione.
In secondo luogo ha capito che invece di trovare qualcuno che aggiungesse delle nuove frasi tradotte nelle varie lingue, potesse essere lo stesso sistema a imparare autonomamente e a fornire delle risposte che possiamo definire senza problemi, “creative”.
In breve Google Translate si è inventato un proprio metalinguaggio o “interlingua” come lo ha chiamato Google stessa per aiutarsi, in autonomia, nelle proprie traduzioni.
La cosa più interessante, però, è che nessuno gli aveva detto di farlo!
Nessun programmatore ha scritto codice per istruire il sistema a inventare questa “interlingua” e nessuna indicazione è stata impartita al sistema affinché andasse in questa direzione.
Quello che è stato “suggerito” è stato semplicemente: “impara da solo a trovare la migliore soluzione al problema”.
Il sistema di machine learning ha sviluppato questo metalinguaggio semplicemente perché ha ritenuto questo metodo il più efficace ed efficiente per risolvere i problemi che gli venivano proposti ovvero migliaia di traduzioni sconosciute in centinaia di lingue diverse.
È rivoluzionario: voi stupidi umani avete continuato a tradurre basandovi su frasi statiche quando era evidente, ed è stato scoperto in poche settimane di tempo, che il modo migliore era quello di creare una lingua “di mezzo” che consente di tradurre da e in tutte le lingue!
Spiegando il funzionamento in modo estremamente semplificato il sistema procede a una normale traduzione e cerca di estendere le regole anche a tutte le altre lingue in modo da autoperfezionarsi ed autocorreggersi.
È dunque possibile, utilizzando l’interlingua, tradurre un testo fra una coppia di lingue che il sistema non ha mai conosciuto prima?
La risposta è sorprendentemente “Sì”: il sistema riesce a tradurre una frase dal coreano al finlandese senza aver mai prima avuto a che fare con queste lingue.
Non serve, come nell’approccio precedente, una preventiva mappatura di frasi e parole.
Utilizzando un sistema di rappresentazione tridimensionale con tre diverse lingue nelle tre dimensioni, gli ingegneri di Google osservando le attività computazionali, hanno rilevato frasi con comune significato ma provenienti dalle tre diverse lingue: ciò significa che la rete neurale sta codificando qualcosa inerente la semantica della frase invece che memorizzare le semplici traduzioni da frase a frase ovvero si sta creando un’interlingua.
E’ davvero possibile dire “Ti amo in tutte le lingue del mondo” e sfruttare questa possibilità nelle strategie di web marketing internazionale e traduzione.
Se vuoi approfondire l’argomento del web marketing internazionale puoi acquistare il mio libro edito da EPC mentre se hai intenzione di internazionalizzare la tua attività puoi contattarci allo 055203971.