mercoledì 1 agosto 2012

Tweetciù! Ovvero come mappare l'influenza con Twitter



Quando ho letto questa news da New Scientist, confesso di aver pensato immediatamente alla frase "tra 7 giorni morirai" del film horror "The Ring" ^_^. La notizia non è proprio in questi termini, ma se leggerete oltre capirete il motivo. 
Sappiamo bene che nei periodi in cui si sviluppa un'epidemia influenzale, è a dir poco impossibile fare in modo di scansarla, perché prima o poi qualche portatore di microbi ci passa accanto. E la situazione ovviamente peggiore all'aumentare del numero di abitanti di una determinata area geografica, perché le aree metropolitane spesso possono sovraffollarsi in determinate zone e, quindi, favorire il passaggio dei microbi tra le persone.
Non sarebbe un'idea attraente se invece riuscissimo a trovare un modo per conoscere quali zone della nostra città sono maggiormente colpite da un'epidemia, in modo da conoscere almeno la probabilità di contrarre un agente patogeno? Ed è così che un team di ricerca della University of Rochester ha voluto mettere a punto un metodo molto attuale e "social" per cercare di mappare un'epidemia influenzale, usando il secondo social network in ordine di importanza mondiale dopo Facebook, ossia Twitter. 
© Adam Sadilek, University of Rochester 
Il gruppo di ricercatori ha avuto l'idea di costruire una sorta di mappa geolocalizzando i tweet di abitanti della città di New York che contenessero parole chiave riguardanti le proprie precarie condizioni di salute, dalle prime avvisaglie fino ai sintomi da raffreddamento vero e proprio, sviluppando un algoritmo capace di prevedere quando un individuo sta per contrarre un'influenza circa 8 giorni prima di manifestare i primi sintomi. 
Questo sistema può ricordare i "Google Flu Trends", ossia i trend influenzali di Google, un sistema di Big G che cerca di monitorare la diffusione di un'influenza sulla base del periodo e della frequenza con cui le persone di una certa area geografica cercano su Google parole chiave legate alle patologie interessate. Esso, tuttavia, cerca di andare oltre i "Google Flu Trends", in quanto l'algoritmo nuovo sa discriminare tra i tweet che contengono parole chiave espresse in un contesto di vera e propria patologia da quelli contenenti parole con differenti sfumature di significato; ad esempio si può parlare di "febbre" d'amore, oppure "influenza virale" legata al grado di diffusione di un'informazione tramite i social media e non soltanto di virus veri e propri. Analizzando oltre 4 milioni di tweets geolocalizzati nell'arco temporale di un mese, il gruppo di ricercatori è riuscito a costruire delle mappe con aree a maggiore e minore incidenza influenzale nella città di New York. Inoltre, una volta geotaggati gli utenti, è anche possibile seguirne gli spostamenti, così da riuscire ad avere un'idea, seppur vaga, sulla direzione della diffusione influenzale e capire quanti altri utenti di Twitter potessero trovarsi nei paraggi, con la possibilità di inviare agli utenti sani un tweet di avvertimento, del tipo: "sei a rischio di beccarti l'influenza entro una settimana" :-).
Ecco un video dell'app sviluppata dai ricercatori, applicata ad una giornata nella città di New York:
Ovviamente questo approccio va preso con la dovuta cautela, perché non è detto che tutti utilizzino Twitter, e anche quando ciò dovesse accadere, non è detto che i Tweeters ammalati vogliano comunicare al mondo le proprie condizioni di salute... Ciò significa che una fetta consistente di possibili ammalati rimane tagliata fuori, con il risultato che non ricevere un tweet di avvertimento non equivale a sentirsi al sicuro, mentre riceverne uno non è garanzia di un futuro peggioramento di salute, per quanto l'algoritmo abbia funzionato già nella prima fase con un buon 90% di utenti preavvisati. Inoltre intuitivamente si comprende come un sistema del genere sia applicabile quasi esclusivamente a città grandi e molto industrializzate, dove molti hanno già interiorizzato il meccanismo di funzionamento dei social network.
Del resto, affidandoci al comune buon senso, nei periodi in cui circolano virus influenzali, sappiamo benissimo che prima o poi ne beccheremo qualcuno, e magari molti di noi avranno un sistema immunitario che saprà combattere bene gli agenti patogeni, e l'allarmismo si risolverebbe in una bolla di sapone. Proviamo però per un attimo a pensare ad algoritmo del genere applicato a patologie ben più serie di una comune influenza: se in qualche modo si riuscisse a controllarne il flusso di movimento, calcolandone la probabilità di diffusione in anticipo, si potrebbero ottenere risultati sorprendenti, magari predisponendo con maggiore prontezza eventuali strategie d'intervento.
Resta comunque una grande idea, innovativa e capace di dimostrare ancora una volta che un uso consapevole dei social media può dare buoni frutti.
Sadilek A., Kautz H., Silenzio V. (2012). Predicting Disease Transmission from Geo-Tagged Micro-Blog Data Twenty-Sixth AAAI Conference on Artificial Intelligence, 2012