Big data: ¿el camino a una sociedad predecible?

Por Leonardo Baranda

Para empezar a entender los niveles de predicción que maneja (y puede llegar a manejar) la sociedad interconectada, primero es necesario definir lo que significa Big Data. Al googlear el término, los primeros resultados son definiciones amistosas de páginas web de empresas, muy parecidas entre ellas. Si bien no están erradas, las mismas no abordan el tema en profundidad y parecen buscar que el lector lo asimile con un concepto simple, sin incidencia ni trascendencia mayor en su vida.

Big Data puede traducirse como “macrodatos”, “datos masivos” o “datos en gran escala”, pero la definición técnica que abarca todo el concepto es el conjunto de datos estructurados, semi-estructurados y no estructurados, y los sistemas encargados de recolectar y analizar los mismos. Es tal la cantidad de datos que podríamos recolectar y analizar, que los softwares convencionales no son capaces de procesarlos y administrarlos en tiempo razonable.

Ahora, ¿cuál es la diferencia entre datos estructurados y no estructurados? Al hablar de estructurados se hace referencia a los archivos de tipo texto que se suelen mostrar en filas y columnas. Son datos que pueden ordenarse y procesarse fácilmente por todas las herramientas de manejo de datos. En cambio, los no estructurados son archivos binarios que no tienen estructura interna identificable. Es decir, un conjunto de elementos que no tienen valor hasta que se organizan y almacenan. Entre ellas, las más conocidas son los correos electrónicos, los archivos PDF, los archivos multimedia, etc.

Se estima que la información que existe en el mundo es equivalente a imaginar 4500 pilas de libros que lleguen hasta el sol. Hace dos años se calculó que existen 5 ZB (ZettaByte) de información, cantidad que se multiplica exponencialmente acorde pasen los años. Para tomar noción de esa medida, tengamos en cuenta que los discos externos que podemos encontrar en cualquier tienda informática tiene un 1TB (TeraByte) de capacidad. Ahora, en 5 ZB entran 5,000,000,000 de discos externos de 1 TB.

Viendo la cantidad exageradamente grande de información que existe, se puede entender que no cualquier equipamiento puede programar algoritmos de Big Data. En esta nueva era tecnológica, la cantidad de datos que generamos es mucho mayor que la que se generaba hace 10 años. Tantos dispositivos conectados, tantas cuentas creadas, tantas conversaciones y llamadas realizadas; todos esos datos quedan almacenados en alguna parte.

Las cuentas en redes sociales, ¿son gratis?

Si uno se pregunta cuánto costó hacer una cuenta en Google, Facebook o Twitter, la respuesta más sencilla y rápida es “nada”, ya que no se debita pago monetario alguno por crearla, pero parte de los “Términos y Condiciones” que se aceptan es la entrega de la valiosa información a las empresas, nuestra información. Esta es la real transacción que se realiza a cambio de sus servicios.

Un dicho popular reza que “El conocimiento es poder”. Hoy por hoy, poder gestionar la Big Data, puede significar poder. Y así lo supieron interpretar personas como Mark Zuckerberg (creador de Facebook) o Larry Page y Serguéi Brin (creadores de Google, aunque su actual CEO es Sundar Pichai). Estas dos redes son las que más usuarios tienen registrados en el mundo (Facebook con alrededor de 600 millones y Google 1.500 millones). Y es ahí donde encuentran su valor en el mercado, cuyo negocio principal es la publicidad.

Cada búsqueda, “me gusta”, “compartir” o “retweet” que se emite termina siendo procesado por hardware y software altamente complejos para su posterior venta a empresas vinculadas al ámbito en el que se ha realizado esta acción. Un ejemplo de esto es que ante una búsqueda de Google (por ejemplo, ropa), al seguir navegando, en los márgenes de las páginas aparecen publicidades de tiendas de indumentaria de diferentes marcas, Mercado Libre, etc.

Este método es agresivo e invasivo, y muchas veces el usuario lo ve de esta manera, pero lo termina aceptando debido a que sigue prefiriendo mantener los servicios brindados por las redes sociales a resguardar su privacidad. ¿Hasta dónde están dispuestos los usuarios a ceder su privacidad con tal de contar con un servicio informático? En la nueva era de la información, el concepto y los límites de la privacidad se van redefiniendo constantemente, y van redefiniendo el comportamiento social y la manera de interactuar con el entorno.

IMG1.jpg

Lo que importa es el resultado

En 2004, Walmart contrató un equipo especializado en compilación y análisis de datos para procesar información a la que nunca había prestado la atención merecida, como por ejemplo el registro de ventas a través de los últimos años. Este equipo generó algoritmos para cruzar estos datos con otros externos y llegó a deducciones sobre el comportamiento de los clientes que incluían los cambios del clima. En épocas de huracanes, la gente compraba baterías (una compra razonable), pero también compraba una especie de galletitas rellenas llamadas Pop-Tarts. No se analizó porqué la gente las consumía, pero cuando hay amenazas de huracanes, al ingresar a un Waltmart hay Pop-Tarts en primera fila.

Hoy por hoy, encuestadores, publicistas y hasta medios de comunicación quedan atrás en el análisis de mercado y marketing. Facebook (y cualquier otra red social masiva) permite conocer los intereses de los usuarios en tiempo real (qué quieren, cuándo lo quieren, cómo lo quieren). Con solo comprárselo a Google, se podría hacer un extenso estudio de mercado, mucho más profundo que el que puede realizar un profesional o un equipo de profesionales.

El ámbito político tampoco se queda atrás. Los partidos políticos son cada vez más conscientes que el uso del Big Data es necesario en los tiempos que corren. Muchos son los beneficios que aporta Big Data en una campaña electoral, principalmente predecir el comportamiento electoral, potenciar la comunicación e integración digital y personalizar el mensaje.

Barack Obama fue uno de los precursores en el uso de Big Data en campañas políticas, el primero en ver el potencial del entorno digital y las redes sociales. Su equipo reconoció 3.5 millones de potenciales votantes no empadronados a través de listas de amigos e intereses en redes sociales (cabe aclarar que en EE.UU., además del voto optativo, es necesario empadronarse). Finalmente, determinó que al menos un millón de sus “usuarios objetivo” decidieron empadronarse. Puede pensarse que fue mucho más efectivo que una campaña llena de carteles, afiches y volantes con la cara del candidato. Donald Trump siguió el ejemplo de su antecesor, pero la estrategia fue distinta. Tomó perfiles de usuarios aptos para votar, y personalizó un mensaje para cada uno de ellos. Aprovechando un mensaje central de campaña, lo adoptó y lo resignificó acorde a su interlocutor.

En Argentina, uno de los pioneros del uso de las redes sociales como una herramienta fuerte de campaña fue Mauricio Macri en 2015. El actual presidente personalizó e individualizó su eslogan de campaña, aunque hasta en ese momento no contaba con estudios de Big Data, sino de “focus group” y encuestas. Su resultado fue el que obtuvieron los políticos estadounidenses, una victoria que lo llevó a Balcarce 50.

Actualmente, Unidad Ciudadana, con Cristina a la cabeza, ha decidido encarar otro rumbo de las típicas campañas electorales del peronismo -cambio que hizo ruido-. Una de las patas más fuertes de Unidad Ciudadana en las elecciones del corriente año fueron las redes sociales, así como la personalización del mensaje. Cristina ha dejado un poco de lado los actos masivos para poder interactuar con ciudadanos puntuales con determinados problemas sociales y económicos; y en la vereda de enfrente, Cambiemos sigue innovando. Una nota recientemente publicada en Clarín, aseguraba que el equipo macrista comenzó a utilizar tecnología de Big Data para su campaña de cara a octubre y poder profundizar el relato construido desde Casa Rosada donde se fabulan discursos de progreso, inversiones y crecimiento económico, ayudados por los medios de comunicación hegemónicos (lisa y llanamente, posverdad).

Al ver y analizar los casos mencionados,  podría señalarse que los algoritmos de Big Data son totalmente “bilardistas”, donde lo único que importa son los resultados. ¿Y los “porqué” de los resultados? ¿Por qué la gente come Pop-Tarts cuando se acercan huracanes? ¿Por qué ganó Obama, Trump, o en el caso argentino, Macri? Al parecer, no importan mucho esas respuestas en el ámbito empresarial y político. Una nueva época del estudio y la estadística se abre donde lo empírico predominará por sobre lo epistemológico. ¿Este cambio en las ciencias sociales, donde se desvaloriza el  “porqué”, termina dejando en un segundo plano a las ciencias sociales?

President Donald J. Trump and First Lady Melania Trump welcome President Mauricio Macri and First Lady Juliana Awada of Argentina

Hacia una sociedad predecible

Para introducirse en la idea de sociedad predecible (o programada), vale citar a un experto en Big Data, Martin Hilbert. En una entrevista realizada por la BBC, el periodista preguntó cuán predecibles son los usuarios, según la información de empresas masivas como Facebook o Google. Hilbert respondió: “Tu teléfono te muestra cuántas llamadas hiciste. El proveedor de telefonía tiene que coleccionar esto, porque te tiene que hacer la cuenta. Ellos ni siquiera se preocupan sobre con quién hablaste o qué hablaste. Es nada más la frecuencia y duración de tus llamadas, lo que se llama metadata. Con eso puedes hacer una ingeniería reversa y reconstruir un censo completo de un país con 80% o 85% de precisión: género, familias, ingreso, educación. Si tengo información un poco más detallada, por ejemplo si el operador de telefonía móvil también registra dónde te mueves, porque te conectas a sus radiobases, se puede predecir hoy con 90% o 95% de precisión dónde vas a estar en dos meses, y en qué momento del día. (…) Unos investigadores de Cambridge hicieron tests de personalidad con gente que les dio acceso a su página de Facebook, y encontraron con cuántos “likes” -un algoritmo de inteligencia artificial- pueden detectar tu personalidad(…) e incluso otras cosas: tu orientación sexual, tu origen étnico, tu opinión religiosa y política, tu nivel de inteligencia, si usas sustancias adictivas o si tus papás están separados. Y detectaron que con 150 “me gusta” el algoritmo podía predecir la personalidad tuya mejor que tu pareja. Con 250 “likes” de Facebook, el algoritmo conoce tu personalidad mejor que tú.

 

Big Data, como tantas otros sistemas informáticos, es una herramienta, sin cargas morales. Usarla para bien o para mal quedará en función del individuo que la utilice. Las tecnologías no determinan tendencias, sino que son socialmente construidas y utilizadas. Pero en tiempos de posverdad, el hecho de que herramientas como Big Data no posean ningún tipo de legislación o regulación en el mundo, resulta como mínimo, alarmante. Las posibilidades de influenciar o implantar ideas en sectores de la sociedad y determinar reacciones de comportamientos, actos o conductas programadas o predecibles, no son ni locas ni ajenas a la cotidianeidad.

 

 

Un comentario sobre “Big data: ¿el camino a una sociedad predecible?

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s