Intelligence & privacy
di Evgeny Morozov
Indagare i comportamenti online non può essere decisivo
I Big Data avrebbero potuto impedire l’11 settembre? Forse. Dick Cheney ne sembra convinto. Facciamoci però un’altra domanda, assai più inquietante: che cosa accadrebbe se i fatti dell’11 settembre si verificassero oggi, nell’era dei Big Data, quando su tutti i diciannove dirottatori degli aerei vi sarebbero inevitabilmente ampie documentazioni digitali?
I fratelli Tsarnaev, gli artefici dell’attentato alla maratona di Boston, appartengono a questa nuova generazione di terroristi, di casa nel mondo di Twitter e di YouTube. Alcuni dei video preferiti da Tamerlan, il maggiore dei due, erano di chiara natura estremista. Se qualcuno avesse analizzato in tempo reale le abitudini dei fratelli nell’uso di Internet, si sarebbe forse potuta evitare una tragedia. Una volta la propensione al terrorismo si valutava dai libri che si leggevano o dai sermoni che si ascoltavano, oggi dai click e dalle app. Non che i libri o i sermoni non siano importanti (lo sono ancora), solo che oggi se ne fa uso in formato digitale, e in questo modo lasciano tracce che permettono di stabilire delle tendenze. I libri che hai acquistato oggi su Amazon sono più radicali di quelli che hai comprato ilmese scorso? In questo caso potresti essere una persona da tenere d’occhio.
La buona notizia — almeno per i sostenitori dei Big Data — è che non dobbiamo necessariamente capire che cosa significhino questi click o questi video. Dobbiamo solo stabilire una relazione tra i terroristi sconosciuti di domani e i terroristi noti di oggi. Se i terroristi che conosciamo hanno un debole per l’hummus di ceci, ad esempio, potremmo attivare dei controlli su chiunque lo acquisti, senza per questo formulare un’ipotesi sul perché piaccia tanto. (In effetti, per un breve periodo tra il 2005 e il 2006, l’Fbi ha fatto proprio questo, sperando di scoprire delle cellule terroristiche iraniane sotterranee: ha passato in rassegna i dati raccolti sui clienti dai negozi di alimentari della zona di San Francisco, alla ricerca di chi comprava cibi mediorientali).
Grazie ai Big Data possiamo smettere di preoccuparci di capire e possiamo concentrarci sulle azioni preventive. Invece di sprecare preziose risorse pubbliche per stabilire i perché — esplorare cioè i motivi per cui i terroristi diventano terroristi — possiamo concentrarci sul prevedere il quando, in modo da poter agire tempestivamente. E una volta che un individuo viene considerato sospetto, sarebbe utile conoscere tutti coloro che appartengono alla sua cerchia sociale: catturare solo uno dei fratelli Tsarnaev avrebbe potuto rivelarsi insufficiente a fermare l’attentato di Boston. La cosa più semplice è quindi registrare tutto: non si sa mai, potrebbe sempre tornare utile.
All’inizio di quest’anno, a una conferenza sul cloud computing, Gus Hunt, Chief Technology Officer della Cia (Central Intelligence Agency), ha affermato che «si conosce il valore di un’informazione solo quando la si collega con qualcos’altro che si verifica in un punto del futuro». Quindi, «dato che non è possibile collegare punti che non abbiamo, siamo sostanzialmente spinti a cercare di raccogliere tutto e a continuare a farlo all’infinito». La «fine della teoria», che pochi anni fa Chris Anderson aveva predetto sulle pagine del magazine «Wired», ha raggiunto la comunità dell’intelligence: proprio come Google non ha bisogno di sapere perché alcuni siti attraggano più link da altri siti, garantendosi così una posizione migliore sul suo motore di ricerca, le spie non hanno bisogno di sapere perché qualcuno si comporti come se fosse un terrorista. Che agisca come un terrorista è più che sufficiente.
Come fa notare l’esperto di media Mark Andrejevic in Infoglut, il suo nuovo libro sulle conseguenze politiche del sovraccarico di informazioni, adottare i Big Data da parte dell’intelligence comporta un costo immenso, anche se poco evidente (lo stesso vale per chiunque li adotti, che operi in settori pubblici o privati). È il costo del trascurare l’approfondimento dei singoli casi, che simanifesta nella riluttanza a indagare le cause delle azioni, passando a occuparsi direttamente delle loro conseguenze. Andrejevic sostiene che se Google può anche permettersi una tale ignoranza, le istituzioni pubbliche non possono farlo.
«Se l’imperativo del data mining è quello di continuare a raccogliere sempre più dati su tutto — scrive Andrejevic — la sua aspirazione è riuscire a utilizzare questi dati, non quella di coglierne un senso». L’obiettivo sia del data mining che dell’analisi predittiva è infatti quello di generare modelli utili che vadano oltre la capacità umana di rilevazione e comprensione. In altre parole, non c’è bisogno di indagare sul perché le cose sono come sono, purché si possa fare in modo che siano come le vogliamo. Questo è piuttosto triste. Se la politica si ponesse l’obiettivo di rinunciare a capire, diventerebbe impossibile fare delle serie riforme.
Dimentichiamo per un momento il terrorismo e prendiamo in considerazione i reati comuni. Perché avvengono? Potremmo rispondere che si verificano perché i giovani non hanno un lavoro adeguato. Oppure perché non abbiamo porte abbastanza robuste. Con una spesa relativamente limitata si potrebbe creare un programma nazionale per il lavoro o equipaggiare le case di videocamere, sensori e serrature migliori. Che cosa fare?
Per un tecnocrate la risposta sarebbe semplice: dovremmo scegliere l’opzione più economica. Ma se fossimo uno di quei — rari — politici responsabili? Solo perché i reati diventano più difficili da compiere non significa che i giovani disoccupati abbiano finalmente trovato lavoro. Le telecamere possono ridurre la criminalità — anche se la cosa è dubbia — ma non vi sono prove che diano maggiore felicità a tutte le persone coinvolte. I giovani problematici si sentiranno come prima senza sbocchi, solo che ora probabilmente indirizzeranno la loro rabbia l’uno contro l’altro. Da questo punto di vista, controllare le strade senza indagare sulle cause del crimine è una strategia poco efficace, almeno nel lungo periodo.
I Big Data sono molto simili alle telecamere di sorveglianza dell’esempio precedente: ci aiutano, forse, a rendere meno frequenti gli attacchi al buon funzionamento del sistema. Ma possono anche farci trascurare il fatto che il problema in questione richieda un approccio più radicale; ci fanno guadagnare tempo, ma ci danno anche una falsa sensazione di controllo.
Possiamo a questo punto tracciare una distinzione tra i Big Data (i numeri che si nutrono di correlazioni) e la Grande Narrazione (un approccio narrativo, antropologico, che cerca di spiegare perché le cose sono come sono). I Big Data sono economici, mentre la Grande Narrazione è costosa. I Big Data sono ordinati, la Grande Narrazione confusa. I Big Data consentono di agire, la Grande Narrazione è paralizzante.
La promessa dei Big Data è permetterci di evitare le insidie della Grande Narrazione. Ma questo è anche il loro maggior difetto. Con un problema di grande impatto emotivo come il terrorismo, è facile credere che i Big Data facciano miracoli. Ma quando consideriamo questioni più banali, diventa chiaro che il super-strumento è piuttosto debole, perché affronta i problemi in modo assai poco fantasioso e ambizioso. Peggio ancora, ci impedisce di discuterne pubblicamente.
Come i cerotti, i Big Data sono importantissimi. I cerotti sono però inutili quando il paziente ha bisogno di un intervento chirurgico. In questo caso insistere con i cerotti potrebbe anche portare a un’amputazione. Ma non c’è modo di saperlo con certezza: così mi dicono i Big Data.
I fratelli Tsarnaev, gli artefici dell’attentato alla maratona di Boston, appartengono a questa nuova generazione di terroristi, di casa nel mondo di Twitter e di YouTube. Alcuni dei video preferiti da Tamerlan, il maggiore dei due, erano di chiara natura estremista. Se qualcuno avesse analizzato in tempo reale le abitudini dei fratelli nell’uso di Internet, si sarebbe forse potuta evitare una tragedia. Una volta la propensione al terrorismo si valutava dai libri che si leggevano o dai sermoni che si ascoltavano, oggi dai click e dalle app. Non che i libri o i sermoni non siano importanti (lo sono ancora), solo che oggi se ne fa uso in formato digitale, e in questo modo lasciano tracce che permettono di stabilire delle tendenze. I libri che hai acquistato oggi su Amazon sono più radicali di quelli che hai comprato ilmese scorso? In questo caso potresti essere una persona da tenere d’occhio.
La buona notizia — almeno per i sostenitori dei Big Data — è che non dobbiamo necessariamente capire che cosa significhino questi click o questi video. Dobbiamo solo stabilire una relazione tra i terroristi sconosciuti di domani e i terroristi noti di oggi. Se i terroristi che conosciamo hanno un debole per l’hummus di ceci, ad esempio, potremmo attivare dei controlli su chiunque lo acquisti, senza per questo formulare un’ipotesi sul perché piaccia tanto. (In effetti, per un breve periodo tra il 2005 e il 2006, l’Fbi ha fatto proprio questo, sperando di scoprire delle cellule terroristiche iraniane sotterranee: ha passato in rassegna i dati raccolti sui clienti dai negozi di alimentari della zona di San Francisco, alla ricerca di chi comprava cibi mediorientali).
Grazie ai Big Data possiamo smettere di preoccuparci di capire e possiamo concentrarci sulle azioni preventive. Invece di sprecare preziose risorse pubbliche per stabilire i perché — esplorare cioè i motivi per cui i terroristi diventano terroristi — possiamo concentrarci sul prevedere il quando, in modo da poter agire tempestivamente. E una volta che un individuo viene considerato sospetto, sarebbe utile conoscere tutti coloro che appartengono alla sua cerchia sociale: catturare solo uno dei fratelli Tsarnaev avrebbe potuto rivelarsi insufficiente a fermare l’attentato di Boston. La cosa più semplice è quindi registrare tutto: non si sa mai, potrebbe sempre tornare utile.
All’inizio di quest’anno, a una conferenza sul cloud computing, Gus Hunt, Chief Technology Officer della Cia (Central Intelligence Agency), ha affermato che «si conosce il valore di un’informazione solo quando la si collega con qualcos’altro che si verifica in un punto del futuro». Quindi, «dato che non è possibile collegare punti che non abbiamo, siamo sostanzialmente spinti a cercare di raccogliere tutto e a continuare a farlo all’infinito». La «fine della teoria», che pochi anni fa Chris Anderson aveva predetto sulle pagine del magazine «Wired», ha raggiunto la comunità dell’intelligence: proprio come Google non ha bisogno di sapere perché alcuni siti attraggano più link da altri siti, garantendosi così una posizione migliore sul suo motore di ricerca, le spie non hanno bisogno di sapere perché qualcuno si comporti come se fosse un terrorista. Che agisca come un terrorista è più che sufficiente.
Come fa notare l’esperto di media Mark Andrejevic in Infoglut, il suo nuovo libro sulle conseguenze politiche del sovraccarico di informazioni, adottare i Big Data da parte dell’intelligence comporta un costo immenso, anche se poco evidente (lo stesso vale per chiunque li adotti, che operi in settori pubblici o privati). È il costo del trascurare l’approfondimento dei singoli casi, che simanifesta nella riluttanza a indagare le cause delle azioni, passando a occuparsi direttamente delle loro conseguenze. Andrejevic sostiene che se Google può anche permettersi una tale ignoranza, le istituzioni pubbliche non possono farlo.
«Se l’imperativo del data mining è quello di continuare a raccogliere sempre più dati su tutto — scrive Andrejevic — la sua aspirazione è riuscire a utilizzare questi dati, non quella di coglierne un senso». L’obiettivo sia del data mining che dell’analisi predittiva è infatti quello di generare modelli utili che vadano oltre la capacità umana di rilevazione e comprensione. In altre parole, non c’è bisogno di indagare sul perché le cose sono come sono, purché si possa fare in modo che siano come le vogliamo. Questo è piuttosto triste. Se la politica si ponesse l’obiettivo di rinunciare a capire, diventerebbe impossibile fare delle serie riforme.
Dimentichiamo per un momento il terrorismo e prendiamo in considerazione i reati comuni. Perché avvengono? Potremmo rispondere che si verificano perché i giovani non hanno un lavoro adeguato. Oppure perché non abbiamo porte abbastanza robuste. Con una spesa relativamente limitata si potrebbe creare un programma nazionale per il lavoro o equipaggiare le case di videocamere, sensori e serrature migliori. Che cosa fare?
Per un tecnocrate la risposta sarebbe semplice: dovremmo scegliere l’opzione più economica. Ma se fossimo uno di quei — rari — politici responsabili? Solo perché i reati diventano più difficili da compiere non significa che i giovani disoccupati abbiano finalmente trovato lavoro. Le telecamere possono ridurre la criminalità — anche se la cosa è dubbia — ma non vi sono prove che diano maggiore felicità a tutte le persone coinvolte. I giovani problematici si sentiranno come prima senza sbocchi, solo che ora probabilmente indirizzeranno la loro rabbia l’uno contro l’altro. Da questo punto di vista, controllare le strade senza indagare sulle cause del crimine è una strategia poco efficace, almeno nel lungo periodo.
I Big Data sono molto simili alle telecamere di sorveglianza dell’esempio precedente: ci aiutano, forse, a rendere meno frequenti gli attacchi al buon funzionamento del sistema. Ma possono anche farci trascurare il fatto che il problema in questione richieda un approccio più radicale; ci fanno guadagnare tempo, ma ci danno anche una falsa sensazione di controllo.
Possiamo a questo punto tracciare una distinzione tra i Big Data (i numeri che si nutrono di correlazioni) e la Grande Narrazione (un approccio narrativo, antropologico, che cerca di spiegare perché le cose sono come sono). I Big Data sono economici, mentre la Grande Narrazione è costosa. I Big Data sono ordinati, la Grande Narrazione confusa. I Big Data consentono di agire, la Grande Narrazione è paralizzante.
La promessa dei Big Data è permetterci di evitare le insidie della Grande Narrazione. Ma questo è anche il loro maggior difetto. Con un problema di grande impatto emotivo come il terrorismo, è facile credere che i Big Data facciano miracoli. Ma quando consideriamo questioni più banali, diventa chiaro che il super-strumento è piuttosto debole, perché affronta i problemi in modo assai poco fantasioso e ambizioso. Peggio ancora, ci impedisce di discuterne pubblicamente.
Come i cerotti, i Big Data sono importantissimi. I cerotti sono però inutili quando il paziente ha bisogno di un intervento chirurgico. In questo caso insistere con i cerotti potrebbe anche portare a un’amputazione. Ma non c’è modo di saperlo con certezza: così mi dicono i Big Data.
(Traduzione di Maria Sepa)
«Corriere della sera» del 30 giugno 2013
Nessun commento:
Posta un commento