Lo que saben de nosotros cuando navegamos

numerati

He encontrado un interesante trabajo interactivo del Wall Street Journal sobre la información que recopilan los Numerati de Internet.

Bueno y ¿qué es un Numerati?

Se trata de una selecta élite matemática que trabaja para grandes empresas online descubriendo una serie de pautas, en base a los rastros que dejamos mientras navegamos por Internet. Los numerati están conformados por equipos de lingüistas, antropólogos, psicólogos, ingenieros electrónicos y científicos cibernéticos, que van recopilando la información que dejamos, para conocer nuestros gustos, necesidades y posibilidades de consumo.

Su fin es conocer el comportamiento humano para luego clasificarlo en diversos grupos, que van desde los consumidores impulsivos y los blogueros hasta los terroristas. A partir de este conocimiento se diseñan políticas publicitarias, empresariales o de otro tipo que se dirigen específicamente a cada grupo en concreto.

Su trabajo, entre otras cosas, permite ofrecernos publicidad personalizada. La acumulación y análisis de los datos que cada día damos sobre nosotros es un laboratorio gigantesco de la conducta humana. Ya se están empleando nuestros datos en modelos predictivos ya que parece ser que somos bastante predecibles, y esto apenas es el comienzo.  El objetivo final no es conocer nuestros hábitos, sino transformarlos. Por ejemplo, si vamos de compras, nos instan a comprar más. Si no compramos, a que lo hagamos. Están decididos a aumentar nuestra productividad. En definitiva, nos controlan. Nos espían, para hablar claro.

Aunque parezca orwelliano esto es así y nosotros aceptamos ese reastreo en la letra pequeña de los términos y condiciones del servicio de muchos websites. O no; simplemete lo hacen cuando entramos en sus websites. Aún así, los mayores y más poderosos Numerati (como el fundador de Google) controlan sólo ciertos terrenos aunque es sólo cuestión de tiempo. Tienen toda la humanidad para modelar y conocernos mejor…

¿Cómo lo hacen?

Voy a poner como ejemplo Yahoo!, según el estudio realizado por el WSJ.

  • Cuando visitas Yahoo! generas 106 de archivos electrónicos de rastreo de información SOBRE TÍ:  64 Cookies, 14 Flash Cookies, 6 Beacons y 22 First-Party tracker files.
  • Yahoo! manda esa información a 21 compañías diferentes, entre las que se encuentran competidores como Google, y a sí mismo para saber qué hacer cuando vuelvas
  • Hay diferentes formas de recopilar información y las comunes son éstas:

Cookies: son pequeños archivos que algunos websites guardan en tu disco duro. Almacenan información, como nombre de usuario o información de registro. Son utilizadas habitualmente por los servidores web para diferenciar usuarios y pueden ser recuperadas por el mismo servidor que las envió. Otros websites utilizan las cookies para personalizar su aspecto según las preferencias del usuario. Lascookies son sólo datos, no código, luego no pueden borrar ni leer información del disco duro de los usuarios, pero permiten detectar las páginas visitadas por un usuario en un sitio determinado o en varios a la vez. Esta información puede ser recopilada en un perfiles anónimos de usuario (no contienen información personal del usuario como nombre o dirección).

Flash Cookies (en español Objeto Local Compartido): son una colección de archivos tipo cookiealmacenadas como archivo en los discos duros. Son usadas por  Adobe Flash Player, que no solicita el permiso del usuario para alojarlas en el disco duro. Normalmente se usan para guardar las preferencias de tu reproductor de audio/vídeo (volumen de sonido preferido, etc), pero la verdad es que cualquier tipo de datos pueden ser alojados, y algunos de ellos tienen que ver con la privacidad. En teoría, la versión actual de Flash no permite a las Flash Cookies a ser compartidas entre dominios.

Beacons (web bugs): es una imagen GIF transparente del tamaño de un píxel dentro de un website o un email. Un web bug se puede utilizar para averiguar si un mensaje de correo electrónico particular ha sido leído por alguien y, si es el caso, cuándo se leyó el mensaje. Tanto en un website como por email pueden recopilar: países de origen, secciones más visitadas, tiempo de permanencia en cada sección, sistema operativo, tipo de ordenador y de navegador, palabras utilizadas en la búsqueda… El análisis posterior de esta información permite realizar una correcta estrategia de marketing.

First-Party tracker files: Generalmente son pequeños archivos de texto inocuos que recuerdan a un website ciertas cosas: por ejemplo, que has puesto en la cesta de la compra de una tienda online.

  • Finalmente se analiza la información mediante software de seguimiento y diferentes computaciones sobre comportamiento online.
  • En el caso de la publicidad, se establece una estrategia de marketing adecuada, para grupos de mismas preferencias, en base a su “rastro online”.

numerati

Visualización de datos sobre el rastreo de las 50 webs más visitadas en USA

En el mapa interactivo “What they know” del Wall Street Journal podéis ver como en la parte EN ROJO del gráfico muestra los 50 websites más populares de USA y EN AZUL cuales son las empresas que realizan seguimientos para su propio uso o para vendérselo a terceros. Las líneas indican quién es propietario de que tipo de información que hemos dejado navegando. Todo esto ha sido posible gracias a que El WSJ contratase a un consultor de tecnología que se dejó rastrear por los 50 websites y luego compaginó los datos obtenidos.

Además se indica cuán expuesta queda una persona que haya estado navegando por esos sitios, en función del rastro que deja, y se pueden elegir varios para comparar.

Dictionary.com me asusta y  Wikipedia es el más respetuoso con nuestros datos, no almacenando ninguno en absoluto.

¡Glup!

¿Glup? ¡Y qué!

Muchas personas pueden preocuparse, como les pasa a políticos y legisladores, de cómo poner freno a una forma de marketing por Internet conocida como targeting del comportamiento. Están implicadas compañías como Yahoo!, Google y miles de pequeñas empresas de publicidad. Llegan a  acuerdos con los principales editores para colocar a cada visitante cookies, permitiendo seguir muchos de nuestros movimientos por la web. Pero hay que pensar que lo único que les interesa son nuestros patrones  de navegación. Somos uno más dentro de un grupo que hace lo mismo. En realidad les dan igual nuestro nombre y apellidos o si somos felices. Les interesa que un tío de Cuenca que lee un artículo sobre hoteles en Londres y consulta el rating de Pacha Londres tendrá más probabilidades que los demás usuarios, según decide un software, de hacer click en un anuncio de British Airways. Así que le colocan uno en una de las páginas “asociadas” de las que ha visitado antes. Y eso no lo veo mal porque es útil.

Aquellos preocupados con la privacidad pueden borrar las cookies de forma periódica, o incluso no aceptarlas. Muchos lo asociamos con la privacidad. Lo cierto es que mucha gente publica detalles de su vida en Facebook, Tuenti y los 140 caracteres de Twitter y han contestado encuestas en websites. Y lo cierto es que queremos que nos conozcan mejor, para poder recibir un servicio personalizado, o ampliar nuestros conocimientos sobre temas que nos interesan mientras navegamos.

Cuando tienes Google Latitude activo en tu iPhone o Blackberry permites compartir datos de localización con tus amigos ¡pero mtambién con Google! Más de 100 millones de personas han descargado ya la aplicación móvil de Facebook; a ellos les permite estudiar los movimientos y patrones de comportamiento de una comunidad creciente. ¿Y qué? Yo no me siento espiado ni manipulado. Lo cierto, y mentiría si dijese lo contrario, es que no tenemos claro todavía qué papel deben tener las máquinas que cada vez más van a ayudar a gestionar nuestras vidas.

Más…

Si tenéis tiempo y os interesa la estética de datos no dejéis de visitar Visual Complexity. Allí podréis ver proyectos como TweetCatcha, que trata de descubrir la naturaleza orgánica del movimiento de artículos del NY Times a medida que viajan a través de Twitter, entre muchos otros.

La gente de Bestiario ha desarrollado otra forma de ver el contenido de Visual Complexity estableciendo relaciones semánticas entre los contenidos, relacionando unos con otros y mediante etiquetas para cada clase de proyecto.

Os dejo una entrevista por videoconferencia a Stephen Baker, que publicó un interesante libro sobre los Numerati:

http://www.youtube.com/watch?v=STHMONEuibg

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *