29 jun 2013

El reto de manejar grandes bancos de datos


 El reto de manejar grandes bancos de datos/Evgeny Morozov es profesor visitante en la Universidad de Stanford y profesor en la New America Foundation. 
Traducción de Juan Ramón Azaola.
El País, 29 de junio de 2013:
¿Se hubiera podido evitar el 11-S con el Big Data? Quizá. Dick Cheney, por poner un ejemplo, parece pensar eso. Pero planteémonos otra pregunta, mucho más provocativa: ¿Qué pasaría si el 11-S hubiera tenido lugar hoy, en la era del Big Data, haciendo prácticamente inevitable que los diecinueve secuestradores de aviones tuvieran extensos historiales digitales?
Los hermanos Tsarnaev, que pusieron las bombas en el maratón de Boston del pasado 15 de abril, pertenecen a esta nueva variedad de terroristas: ambos se sentían a sus anchas en el mundo de Twitter y de YouTube. Y algunos de los vídeos que Tamerlán, el hermano mayor, supuestamente tenía como favoritos son de naturaleza claramente extremista. Si alguien hubiera estado analizando los hábitos de visionado de los hermanos en tiempo real, podría haberse evitado una gran tragedia.
Antes solía medirse la propensión de alguien al terrorismo en libros o en sermones; hoy se mide en clics o en apps (aplicaciones). No es que libros y sermones ya no importen, es que hoy se consumen digitalmente, de un modo que hace que dejen una pista, y esa pista permite establecer pautas. ¿Son los libros que hoy has comprado por Amazon más radicales que los que compraste el mes pasado? Si es así, podrías ser persona objeto de interés.

La buena noticia —al menos para los partidarios del Big Data— es que no necesitamos comprender lo que significan cada uno de esos clics o de esos vídeos. Solamente necesitamos establecer cierta relación entre los desconocidos terroristas de mañana y los verificados terroristas de hoy. Si los terroristas que conocemos tienen una inclinación por, digamos, el hummus, entonces podríamos querer aplicar una estrecha vigilancia sobre cualquiera que lo haya comprado alguna vez, sin desarrollar nunca una hipótesis sobre por qué el hummus gusta tanto. (De hecho, durante un breve período de tiempo en 2005 y 2006, el FBI, con la esperanza de encontrar unas células terroristas secretas iraníes, hizo precisamente eso: accedió a los datos de clientes en poder de los supermercados del área de San Francisco investigando en los registros de ventas de alimentos de Oriente Próximo.)
Gracias al Big Data podemos dejar de preocuparnos por la comprensión y en lugar de ello centrarnos en la acción preventiva. En vez de gastar los preciosos recursos públicos en tratar de entender los “porqués” —analizando las razones por las que los terroristas se hacen terroristas— uno se puede centrar en los “cuándos”, de manera que se pueda realizar una intervención a tiempo. Y una vez que alguien haya sido identificado como sospechoso, lo inteligente será conocer a todos los de su red social: atrapar con antelación solamente a uno de los hermanos Tsarnaev tal vez no hubiera impedido las bombas de Boston. Así que, sencillamente, uno está en mejores circunstancias grabándolo todo, nunca se sabe cuándo puede resultarte útil.
Gus Hunt, el director de tecnología de la CIA, así lo dijo a principios de este año. “El valor de todo elemento de información sólo se conoce cuando puedes conectarlo con algo que llega en un momento futuro”, dijo en una conferencia sobre computación en la nube. De este modo, “ya que no puedes atar cabos que no tienes, eso nos lleva a actuar de un modo en el que fundamentalmente intentamos recopilar todo y aferrarnos a ello para siempre”. La conclusión de la teoría que Chris Anderson predijo en las páginas de la revista Wired hace unos años ha alcanzado a los servicios de inteligencia: lo mismo que Google no necesita saber porqué algunos sitios web contienen más vínculos que otros —asegurándose con ello un mejor puesto en los resultados de búsqueda— los espías no necesitan saber porqué algunas personas se comportan como terroristas. Les basta con que actúen como terroristas.
Como señala el teórico de la comunicación Mark Andrejevic en Infoglut, su nuevo libro sobre las implicaciones políticas de la sobrecarga informativa, hay un inmenso —aunque generalmente invisible— coste en la adopción del Big Data por los servicios de inteligencia (y por casi todos los demás sectores públicos y privados). Ese coste es la devaluación de la comprensión individual, encarnada por nuestra reticencia a investigar las causas de las acciones y saltar directamente a sus consecuencias. Pero, sostiene Andrejevic, mientras Google puede permitirse ser ignorante, las instituciones públicas no.
“Si el imperativo de la minería de datos es el de recolectar más y más datos sobre todo”, escribe, “su promesa es la de poner esos datos a trabajar, no necesariamente la de darles un sentido. De hecho, el objetivo tanto de la minería de datos como del análisis predictivo es el de generar pautas de utilidad cuya detección o incluso explicación están mucho más allá de la capacidad de la mente humana”. En otras palabras, no necesitamos averiguar por qué las cosas son como son mientras nosotros podamos influir en que sean como queremos que sean. Lo cual es bastante triste. El abandono de la comprensión como un útil objetivo de lo público hará imposible emprender unas reformas políticas serias.
Olvidemos el terrorismo por un momento. Tomemos algo tan prosaico como la delincuencia. ¿Por qué tiene lugar la delincuencia? Bien, puedes decir que es debido a que los jóvenes no tienen los trabajos adecuados. O puedes decir que es debido a que las puertas de nuestros edificios no están lo suficientemente fortificadas. Dado un cierto límite de fondos disponibles, puedes o bien crear un nuevo programa nacional de empleo o bien equipar las casas con todavía mejores cámaras, sensores y cerraduras. ¿Qué deberías hacer?
Si eres un gestor tecnócrata, la respuesta es fácil: escoges la opción más barata. Pero, ¿y si perteneces a la rara especie del político responsable? El hecho de que ciertos delitos sean ahora más difíciles de cometer no significa que los jóvenes anteriormente desempleados por fin hayan encontrado empleo; es posible que las cámaras de vigilancia reduzcan la delincuencia —aunque incluso la evidencia es en este caso contradictoria— pero no hay estudios que demuestren que resulte de ello una mayor felicidad de los implicados. Los jóvenes problemáticos siguen estando tan frustrados como antes, solo que ahora, quizá, lo reflejan en forma de agresividad recíproca. A partir de esta lectura, fortificar nuestras calles sin investigar en las raíces de las causas de la delincuencia es una estrategia contraproducente, al menos a largo plazo.
En esta analogía, el Big Data tiene mucho parecido con la cámara de vigilancia. Sí, puede ayudarnos a hacer algunas alteraciones poco frecuentes en la salud del sistema. Pero puede también cegarnos frente al hecho de que el asunto que nos ocupa requiere de un enfoque más radical; nos compra tiempo pero también nos da una falsa ilusión de dominio.
Podemos establecer una distinción a este propósito entre Big Data —un asunto de números que se alimenta de las correlaciones—y Big Narrative, una aproximación antropológica, impulsada por el relato, que intenta explicar porqué las cosas son como son. El Big Data es barato mientras que el Big Narrative es caro. El Big Data es claro mientras que el Big Narrative es borroso. El Big Data es factible mientras que el Big Narrative es paralizante.
La promesa del Big Data consiste en que nos va a permitir evitar los escollos del Big Narrative. Pero ese es también su mayor coste. Con un problema tan sumamente emocional como el del terrorismo es fácil creer que el Big Data va a hacer maravillas. Pero una vez que nos desplazamos a cuestiones más prosaicas, resulta obvio que la super-herramienta que se pretende que sea es un instrumento más bien débil que aborda los problemas de manera muy poco imaginativa y ambiciosa. Y, lo que es peor, nos impide que tengamos muchos debates públicos importantes. Si es cuestión de tiritas, el Big Data es excelente. Pero las tiritas son inútiles cuando lo que necesita el paciente es una operación quirúrgica. En ese caso, un amor desmedido por las tiritas resulta ser generalmente la etapa precursora de una amputación. Pero no tengo el modo de saberlo con certeza: eso es lo que el Big Data me dice.

No hay comentarios.:

Hoy es el recorrido de "La novia de Culiacán"

Guadalupe Leyva, o mejor conocida como «Lupita, la novia de Culiacán» es una leyendas de de la capital del estado.  Este domingo 22 de dicie...