Il problema riguarda la maggior parte degli idiomi europei
di Carolina Saporiti
La percentuale di chi parla l'italiano è destinata a calare. Necessari investimenti sostanziali in tecnologie linguistiche
Investire o scomparire. È questo il futuro della lingua italiana su intenet. A dirlo è il rapporto La lingua italiana nell’era digitale, condotto dall’Istituto di linguistica computazionale del Cnr di Pisa (Ilc-Cnr). La percentuale delle pagine web in italiano a livello mondiale è raddoppiata passando dall’1,5% nel 1998 al 3,05% nel 2005 ed è stato stimato che nel 2004, in tutto il mondo, fossero 30,4 milioni le persone che parlavano italiano online.
I NUMERI - Oggi, secondo i ricercatori, la penetrazione del web in Italia si attesta al 51,7%, pari a 30 milioni di internauti su 58 milioni di cittadini (circa il 6,3% di quelli dell’Ue), registrando una crescita del 127,5% tra il 2000 e il 2010. Inoltre al di fuori dei confini dell’Unione Europea, parlano la nostra lingua 520 mila americani, 200 mila svizzeri e 100 mila australiani. Il numero di «navigatori» italiani però è rimasto stabile negli ultimi cinque anni mentre è aumentato il numero di quelli dei Paesi in via di sviluppo. In qualche anno la proporzione di coloro che parlano la nostra lingua subirà dunque una forte diminuzione.
RISCHI - Il rischio? Subire una sotto-rappresentazione, specialmente in confronto all’inglese. Il problema non riguarda solo l’Italia ma la maggior parte degli idiomi europei, specialmente quelli dei Paesi con pochi abitanti. Spiega Claudia Soria dell’Ilc-Cnr: «Il nostro Paese non è tra i peggiori e d’altra parte nessuna nazione dell’Ue ha supporti eccellenti. La situazione è però preoccupante perché le tecnologie linguistiche usate in Internet si basano su approcci statistici e quindi se i dati messi a disposizione in un idioma sono pochi, si innesta un circolo vizioso: pochi dati, tecnologie di bassa qualità, ulteriore limitazione dell’uso di quella lingua».
TECNOLOGIE - L’Italia ha a disposizione buone tecnologie, ma affinché un dispositivo possa riconoscere un idioma sono necessari investimenti sostanziali in tecnologie linguistiche. Al momento, invece, in Europa la maggior parte dei Paesi sta investendo poco o niente. L’ultimo programma di questo tipo promosso dall’Italia risale al 2000-2002. L’italiano come lingua non corre nessun rischio, ma in un futuro prossimo gli italiani potrebbero trovarsi nella situazione di dover usare due linguaggi differenti a seconda che si tratti di comunicazione quotidiana o digitale. «Se l’italiano non viene sostenuto, il suo utilizzo online rischia di atrofizzarsi, dal momento che la nostra vita si svolge sempre di più attraverso la rete», spiega Soria.
STUDIO - Lo studio, condotto dall’Istituto Cnr e dalla Fondazione Bruno Kessler, fa parte della ricerca Meta-Net a cui hanno lavorato più di 200 esperti. Il rapporto valuta il supporto delle tecnologie linguistiche per ogni lingua in quattro aree diverse: la traduzione automatica, l’interazione vocale, l’analisi del testo e la disponibilità di risorse linguistiche. Il 70% si colloca al livello più basso, con «supporto debole o assente» per almeno una delle aree considerate. L’islandese, il lituano, il lettone e il maltese ottengono questo voto per tutte le aree. All’estremo opposto si trova l’inglese, seguito da olandese, francese, tedesco, italiano e spagnolo. Lingue come basco, bulgaro, catalano, greco, ungherese e polacco si collocano nell’insieme «ad alto rischio». «Sono risultati allarmanti», conclude Hans Uszkoreit, coordinatore di Meta-Net. «La maggior parte delle lingue europee non dispone di risorse sufficienti e alcune sono quasi completamente ignorate. Molte di esse non hanno futuro».
I NUMERI - Oggi, secondo i ricercatori, la penetrazione del web in Italia si attesta al 51,7%, pari a 30 milioni di internauti su 58 milioni di cittadini (circa il 6,3% di quelli dell’Ue), registrando una crescita del 127,5% tra il 2000 e il 2010. Inoltre al di fuori dei confini dell’Unione Europea, parlano la nostra lingua 520 mila americani, 200 mila svizzeri e 100 mila australiani. Il numero di «navigatori» italiani però è rimasto stabile negli ultimi cinque anni mentre è aumentato il numero di quelli dei Paesi in via di sviluppo. In qualche anno la proporzione di coloro che parlano la nostra lingua subirà dunque una forte diminuzione.
RISCHI - Il rischio? Subire una sotto-rappresentazione, specialmente in confronto all’inglese. Il problema non riguarda solo l’Italia ma la maggior parte degli idiomi europei, specialmente quelli dei Paesi con pochi abitanti. Spiega Claudia Soria dell’Ilc-Cnr: «Il nostro Paese non è tra i peggiori e d’altra parte nessuna nazione dell’Ue ha supporti eccellenti. La situazione è però preoccupante perché le tecnologie linguistiche usate in Internet si basano su approcci statistici e quindi se i dati messi a disposizione in un idioma sono pochi, si innesta un circolo vizioso: pochi dati, tecnologie di bassa qualità, ulteriore limitazione dell’uso di quella lingua».
TECNOLOGIE - L’Italia ha a disposizione buone tecnologie, ma affinché un dispositivo possa riconoscere un idioma sono necessari investimenti sostanziali in tecnologie linguistiche. Al momento, invece, in Europa la maggior parte dei Paesi sta investendo poco o niente. L’ultimo programma di questo tipo promosso dall’Italia risale al 2000-2002. L’italiano come lingua non corre nessun rischio, ma in un futuro prossimo gli italiani potrebbero trovarsi nella situazione di dover usare due linguaggi differenti a seconda che si tratti di comunicazione quotidiana o digitale. «Se l’italiano non viene sostenuto, il suo utilizzo online rischia di atrofizzarsi, dal momento che la nostra vita si svolge sempre di più attraverso la rete», spiega Soria.
STUDIO - Lo studio, condotto dall’Istituto Cnr e dalla Fondazione Bruno Kessler, fa parte della ricerca Meta-Net a cui hanno lavorato più di 200 esperti. Il rapporto valuta il supporto delle tecnologie linguistiche per ogni lingua in quattro aree diverse: la traduzione automatica, l’interazione vocale, l’analisi del testo e la disponibilità di risorse linguistiche. Il 70% si colloca al livello più basso, con «supporto debole o assente» per almeno una delle aree considerate. L’islandese, il lituano, il lettone e il maltese ottengono questo voto per tutte le aree. All’estremo opposto si trova l’inglese, seguito da olandese, francese, tedesco, italiano e spagnolo. Lingue come basco, bulgaro, catalano, greco, ungherese e polacco si collocano nell’insieme «ad alto rischio». «Sono risultati allarmanti», conclude Hans Uszkoreit, coordinatore di Meta-Net. «La maggior parte delle lingue europee non dispone di risorse sufficienti e alcune sono quasi completamente ignorate. Molte di esse non hanno futuro».
«Corriere della sera» del 28 ottobre 2012
Nessun commento:
Posta un commento