Big Data, Big Peligro!
Supongo que estas ya cansado de oír hablar del «Big Data» pero, para mi, es uno de los fenómenos mas importantes que está por venir y creo que en el 2015 lo vamos a apreciar mas que nunca. Este artículo estará en constante revisión pues la información que pretendo resumir es mucha y seguro que las novedades que están por llegar serán constantes. Aquí empieza un mega blog…
El «Big Data» es un concepto general que agrupa técnicas de adquisición de datos a nivel mundial aprovechando la actual conectividad global, para su posterior tratamiento y análisis, con el fin de definir como se comporta el Mundo a día de hoy y mejorar la toma de futuras decisiones a todos los niveles. Algo brutal que escapa a nuestra imaginación pero de lo que no somos ajenos, simplemente cabe revisar ¿Que sabe Google de mi? para empezar a preocuparnos por este asunto…
En 2010 el presidente ejecutivo de Google, Eric Schmidt, dijo que el mundo generaba 5 Exabytes de datos cada dos días. A buen seguro que hoy ya tienen capacidad para almacenar mas del doble. Empresas como Google, IBM, Intel, Salesforce, Verizon, etc. (por citar algunas muy conocidas y visibles) y otras tantas corporaciones privadas están trabajando hace mucho tiempo en la adquisición de datos global y en crear herramientas de análisis que sean capaces de gestionar tal ingente cantidad de información con el fin de definir tendencias y tomar decisiones futuras, ejem, «acertadas» aunque seguro que eso atenderá primero a intereses nacionales, comerciales y militares olvidando esa quimera de que el objetivo real debería ser «mejorar» el Mundo en el que vivimos. :-/
Para ilustrar el concepto hablemos primero del proyecto Watson de IBM. Watson es un sistema informático de inteligencia artificial que aplica técnicas de computación cognitiva [*] con capacidad de responder a preguntas formuladas en lenguaje natural. Para mostrar sus habilidades al gran público el sistema se enfrentó a dos grandes estrellas del concurso de televisión Jeopardy! en USA y los venció sin mayor dificultad. Su fuente de conocimiento era una base de datos propia alimentaba por multitud de fuentes: enciclopedias, diccionarios, tesauros, noticias, obras literarias e incluso bases de datos externas como DBpedia, WordNet, etc.
El proyecto ha ido creciendo de forma exponencial y hoy en día se integra con infinidad de fuentes de información de todo el mundo y colabora con alianzas tecnológicas en múltiples sectores. Siempre en mi ánimo de citar ejemplos concretos que ayuden a entender algo tan global destaco aquí su acuerdo con CaixaBank en España en el que colaboran para desarrollar un sistema cognitivo [*] basado sobre Watson para comprender el idioma español. Este es solo un pequeño ejemplo entre todo el abanico de colaboraciones mundiales en los que anda metido este proyecto y nos ayuda a poner «cara» a ese concepto de Big Data.
Bueno, pero… ¿realmente me interesa el «Big Data»?
Si hay algo mas valioso que el dinero eso es la información, la correcta información. La información es poder, sobre todo si se explota y se analiza de forma eficiente. La ventaja competitiva que ofrece disponer de la mejor información no tiene rival, sea el sector que sea. Empresas como Google tienen este concepto muy claro desde hace mucho tiempo y, en mi opinión, están a años luz del resto en este sentido. El manejo correcto del Big Data es la llave del futuro y ellos la tienen en su mano.
Me preocupa lo abstracto del concepto por lo que voy a añadir algunos números para dimensionar algo que nadie es capaz de cuantificar. Según IBM el 90% de los datos del mundo han sido creados durante los últimos dos años y se estima que, al ritmo actual, la información acumulada se duplica cada 18 meses. Esto supone una velocidad de crecimiento siete veces mayor a la del mercado global de la información y las comunicaciones. Para guardar toda esta info, en 2014 ya existen mas de 3 millones de centros de datos, solo en los EEUU. ¿Te sale humo de la cabeza? A mi también!
El Big Data se genera en base a tres pilares básicos: personas, empresas y ciudades.
- Los personas, sin ser conscientes de ello, generan gran cantidad de información relacionada con sus hábitos diarios: sitios a los que van, en qué y dónde trabajan, con quién se relacionan, qué momentos de ocio tienen y en qué los ocupan, etc. La tecnología actual traduce todo eso en datos automáticamente.
- El empresario, consciente de que los hábitos de consumo tienen gran valor, trata de encontrar las herramientas adecuadas para que el usuario entregue «gentilmente» todos esos datos: descuentos en comercios, eMails publicitarios, «likes» sociales, productos con geo-localización, etc.
- Las ciudades, con el ánimo de llevar a cabo una gestión más eficiente, tratan de captar las necesidades y hábitos de sus ciudadanos, que se transforman también en cantidades ingentes de datos y que son un amplio mercado para las empresas que buscan cómo dirigir más eficazmente la publicidad de sus productos a los potenciales clientes.
En el centro de estos tres pilares nacen las empresas de «Cloud Computing» que lo sostienen todo, con Google a la cabeza. Así nace y crece la era actual, la era del «Big Data» donde el gran reto de las gobiernos, empresas y asociaciones consiste en una mejor gestión de sus datos para transformarlos en información eficaz y, al fin, PODER con mayúsculas.
Ahora vamos a quedarnos en nuestro barrio que es mas coqueto. 🙂 El 1 de Enero de 2015, siempre tarde y mal, nace en Europa una nueva asociación centrada en el «Big Data» con el objetivo de coordinar esfuerzos de investigación públicos, privados y académicos de macro-datos en ámbitos como la energía, la fabricación, la salud, la logística alimentaria, etc. Esta iniciativa complementará el actual programa europeo «Horizonte 2020» que ya gestiona temas como la fotónica, la robótica, informática de alto rendimiento, redes 5G, etc.
Voy a poner otro ejemplo de mal narrador. En el ámbito del deporte, y en concreto del fútbol que mueve tanto dinero, hace muchos años que se utilizan tecnologías que podemos considerar como «Big Data» de bolsillo. Nos encontramos, por ejemplo, que el análisis de los partidos constituye una parte fundamental en el entrenamiento de los profesionales y la toma de decisiones de los entrenadores. Amisco es un sistema aplicado por las más importantes ligas europeas desde 2001. Consta de 8 cámaras y diversos ordenadores instalados en los estadios, que registran los movimientos de los jugadores a razón de 25 registros por segundo, y luego envían los datos a una central donde hacen un análisis masivo de los datos. La información que se devuelve como resultado incluye una reproducción del partido en dos dimensiones, datos técnicos, estadísticas y un resumen de los datos físicos de cada jugador. Nada queda al azar previo al partido, otra cosa es que la «pelotita» quiera entrar o no. «Big Data» de bolsillo.
Muy bonito, pero… ¿quien controla todo esto?
En España, como es natural, nada de nada al respecto pero bueno, de momento, somos Europa. En mayo de 2014, el Grupo Europeo de Protección de Datos hizo público un documento en el que se especifica la manera en la que se podrían gestionar los datos correspondientes a individuos concretos. Se denominan “técnicas de anonimización” y consisten en utilizar programas que disocian los datos captados generando un extenso mosaico sobre sus movimientos y preferencias. En cierta forma se intenta garantizar la privacidad de los usuarios pero, francamente, dudo mucho de su éxito.
Ahora, las autoridades europeas han aprobado el primer dictamen conjunto sobre «el Internet de las cosas». El documento está dirigido a fabricantes de dispositivos, desarrolladores de aplicaciones y gestores de redes sociales, por un lado, y a usuarios que van a utilizar estos equipos conectados, por otro. El dictamen plantea tres escenarios: la conocida como tecnología para llevar puesta, los «wearables», los dispositivos capaces de registrar información relacionada con la actividad física de las personas y la domótica. Se advierte en el dictamen que esta captación disociada de datos podría revelar aspectos específicos de hábitos, comportamientos y preferencias, configurando auténticos patrones de la vida de las personas. Las autoridades europeas alertan de que el usuario podría perder el control sobre la difusión de sus datos dependiendo de la mayor o menor transparencia con que se realice su captación. En resumen, que vamos apañaos, hagamos lo que hagamos sabrán hasta la talla del calzoncillo. 🙂
Para acabar esta primera versión del artículo quiero aportar mi experiencia personal y profesional en el tema, sin citar nombres para no meterme en mas líos! Hace ya 15 años Yo trabajé en una empresa española de distribución de sistemas de seguridad. Vendíamos productos de procedencia israelita capaces de realizar grabaciones de vídeo y audio de forma masiva, capaces luego de analizar todos esos datos de forma sorprendente. Cuerpos de seguridad del Estado, empresas de Telefonía, sector bancario, etc. todo el mundo grababa las conversaciones telefónicas y mantenía archivos de grabaciones de vídeo. Si hace 15 años ya eramos capaces de almacenar eso, ¿que no se podrá hacer ahora? Estamos peligrosamente embebidos en el «Big Data» y no somos conscientes de ello, puaf!
Realmente no lo sabia, sigo pensando que la mejor forma de no estar en el sistema es no entrando. Recuerdo la escena final de Red de Mentiras cuando un personaje les esplica a los de la Cia que son inutiles los satiles espias y todos los medio de vigilancia que pongan. Los terroristas no usan moviles que se puedan rastrear. Usan el boca a boca con lo cual es imposible saber si esos dos que estan hablando comentan que su prima esta de parto o que van a poner una bomba tal dia. O se limitan a pasar papelitos que luego queman o se los comen.
Todo eso me lleva a pensar que no deberiamos usar las tarjetas de credito, no quiero que el staf sepa que el dia diez de enero me compre 3 tangas de una determinada marca en las rebajas. La uso lo menos posible pero alguna vez simplemente porque quizas necesito gasolina y me he dejado el dinero en casa.
Hace tiempo compre unas cosas en determinada perfumeria, me ofrecieron amablemente hacerme la tarjeta de cliente asi gozaria de descuentos. Vale . Me piden direccion nombre y mail.¿Mail? ¿pa que pa llenarmelo de publicidad? Les dije que no tenia internet, hasta me decian que diera el de algun familiar, si claro para que despues me corriera a gorrazos, el mail es como el telefono, no se da el telefono de alguien asi como asi. Les dije que no. La chica se marcho a consultar y acabo diciendome que sin mail no habia tarjeta de clinte. El resultado es que no les volvi a comprar nunca mas.
Un placer leerte.
Asunto importante, cuando le das al link de lo que conoce Google de mi, se reinicia el ordenador. Gracias
Carles, ese enlace te lleva al Panel de control de Google donde hay un resumen de tu actividad. Quizás sea que Papa Google sabe demasiado de ti y el PC no lo puede soportar! 🙂
jajaja! a mi me mando al Panel de control de mi cuenta google! increible tuve mas de 42 contraseñas distintas jaja!
PD: Tremendo material la verdad que siempre dije que «Si hay algo mas valioso que el dinero eso es la información, la correcta información.» EL SABER ES PODER! ;D
No me gusta hacer predicciones pero… en 2015 se calcula que van a conectarse a Internet 25 billones (con «bbb» de burro) de nuevos dispositivos relacionados con los hogares, ejem, inteligentes. La «Internet de las cosas» lo llaman, la «Internet de los Peligros» lo llamaría Yo. :/