Con el triunfo de Obama, ganó el «Big Data»
Mariano Blejman en el diario Página/12 describe el escenario mundial del análisis de una innumerable cantidad de información generada, en su gran mayoría, por los usuarios de redes sociales, la cual puede utilizarse, por ejemplo, para definir una elección presidencial como la de Estados Unidos.
Frente a la Casa Blanca se oficializó públicamente la primera victoria electoral del análisis de grandes volúmenes de datos. O sea, fue la primera victoria electoral del big data. La campaña de Barack Obama tuvo detrás una ingeniería jamás vista de conexión entre la información de los posibles votantes publicada en Internet, los perfiles de acceso, las posibilidades de encontrar donantes, metodología que sólo pertenecía a grandes corporaciones dedicadas a las finanzas. El análisis de grandes volúmenes de información le permitió al equipo de campaña de Obama detectar rápidamente personalidades influyentes en las redes sociales (Facebook, Twitter, Google+, LinkedIn) y hacer campañas sobre estos perfiles para que influyan en los sectores donde los números estaban bajos, o enviar correos electrónicos diferenciados según posibilidades de colaborar con la campaña y hasta el mismo día de las elecciones, llamar por teléfono a las casas de los votantes que todavía no habían votado. Estos detalles, y muchos otros que lamentablemente no pueden ser revelados por pedido expreso del autor, fueron contados por Harper Reed, jefe tecnológico de la campaña de Obama, en el encuentro News Foo en Phoenix al que asistió este cronista en noviembre pasado. Reed contó cómo combinaban información de evolución de las votaciones, y cómo se podía predecir unos días antes que la victoria iba a ser para Obama gracias al análisis de grandes volúmenes de información.
El análisis de grandes volúmenes de información le permitió al equipo de campaña de Obama detectar rápidamente personalidades influyentes en las redes sociales (Facebook, Twitter, Google+, LinkedIn) y hacer campañas sobre estos perfiles para que influyan en los sectores donde los números estaban bajos, o enviar correos electrónicos diferenciados según posibilidades de colaborar con la campaña y hasta el mismo día de las elecciones, llamar por teléfono a las casas de los votantes que todavía no habían votado.
El crecimiento de la cantidad de información disponible en Internet se ha acelerado en los últimos tres años de forma exponencial. Según un estudio de EMC, mientras en 2010 había disponibles 1227 Exabytes (miles de millones de Gigas), en 2015 habrá 8591 Exabytes y en 2020 habrá disponibles 40 mil Exabytes. Esto se explica no sólo por la cantidad de información generada por usuarios cada vez más conectados, sino también por la nueva generación de Internet en la que “las cosas” generarán y publicarán su propia información. Se calcula que contra los 7.6 mil millones de personas conectadas en 2020, habrá 200 mil millones de “cosas” conectadas. EMC considera que todavía hay un gran camino por recorrer en el mundo del big data: 23 por ciento del universo digital sería útil si fuera etiquetado y analizado, el 3 por ciento podría ser efectivamente analizado en la actualidad y considera que apenas el 1 por ciento del contenido es realmente analizado en realidad. De la información que debería estar protegida, apenas el 19 por ciento lo está.
El 68 por ciento de la información del universo digital es generada y usada por los mismos consumidores, en redes sociales, enviando imágenes y videos, entre dispositivos móviles. En 2012 se alcanzaron 400 millones de tweets por día, mil millones de usuarios de Facebook y 20 mil millones de mensajes de texto. Y lo mejor es que hay “esperanza” para los países emergentes: para 2020 los mercados emergentes reemplazarán a los países desarrollados como los principales productores de datos mundiales. Tal evolución de los datos está generando una oportunidad para empresas, organizaciones, redacciones que están cambiando la forma de acceder a las noticias, a información sensible, a campañas de marketing y a las redes sociales.
En 2012 se alcanzaron 400 millones de tweets por día, mil millones de usuarios de Facebook y 20 mil millones de mensajes de texto. Y lo mejor es que hay “esperanza” para los países emergentes: para 2020 los mercados emergentes reemplazarán a los países desarrollados como los principales productores de datos mundiales.
La plataforma abierta Hadoop –que forma parte de la Fundación Apache, servidor basado en Linux que se usa en el 70 por ciento de los web servers de Internet– está destinada a buscar, analizar e interpretar grandes volúmenes de datos. Nuevas imágenes tridimensionales se utilizan para comprender gráficamente evoluciones mundiales. Nuevas herramientas de visualización aparecen para comprender, por ejemplo, cómo viajan los aviones por el mundo, cómo se mueve una epidemia a nivel global con niveles de precisión y prevención notables, cómo se visualizan las relaciones de Facebook de manera geolocalizada. El tema es el santo grial de la nueva economía de las grandes empresas, y hasta tiene una gran conferencia organizada por O’Reilly llamada Strata, “haciendo trabajar a los datos” es su slogan, y suele llevar la frase “únase a la revolución de los datos” (suena mejor en inglés, “Join the Data Revolution”) donde se proponen desafíos para resolver problemas de grandes volúmenes de datos.
¿Qué es el «Big Data»?
La definición hace referencia a conjuntos de datos que superan la capacidad del software habitual para ser capturados, gestionados y procesados en un tiempo razonable. Asimismo, Big Data involucra el trabajo de obtención de información de esos datos y eventualmente su manipulación con distintos fines.
Si bien gran parte existen en Internet, los llamados «datos estructurados» (aquellos almacenados en distintas bases de datos) representan apenas el 20 por ciento del total; el 80 por ciento de la información en la Web es provisto por las herramientas sociales y se lo considera «desestructurada». Allí radica la oportunidad para quienes quieren descubrir información clave para cumplir sus objetivos, de los más nobles a los más reprobables.