Eleva tus habilidades de liderazgo y negocios

Súmate a más de 52,000 líderes en 90 empresas mejorando habilidades de estrategia, gestión y negocios.


Cuatro maneras de mirar Twitter

La visualización de datos es genial. También es cada vez más útil, ya que la vibrante comunidad en línea de los visualizadores de datos (programadores, diseñadores, artistas y estadísticos, a veces en una sola persona) crece y las herramientas para ejecutar sus visiones mejoran. Jeff Clark es parte de esta comunidad. Él, como muchos entusiastas de la visualización de datos, cayó en ella después de […]
Cuatro maneras de mirar Twitter

La visualización de datos es genial. También se está volviendo cada vez más útil, a medida que crece la vibrante comunidad online de visualizadores de datos (programadores, diseñadores, artistas y estadísticos, a veces todos en una sola persona) y mejoran las herramientas para ejecutar sus visiones.

Jeff Clark es parte de esta comunidad. Él, como muchos entusiastas de la visualización de datos, cayó en ella después de ser inspirado por el pionero Martin Wattenberg de mapa de árbol hito que visualizó el mercado de valores.

El último trabajo de Clark muestra mucha promesa. Ha construido cuatro motores que visualizan esa pila gigante de datos conocidos como Twitter. Los cuatro básicamente buscan palabras usadas en tweets, luego buscan relaciones con otras palabras o con otros Tweeters. Funcionan casi en tiempo real.

«Twitter es una fuente de datos obvia para mucha información de texto», dice Clark. «En realidad, se ha demostrado que es un gran patio de juegos para probar ideas de visualización de datos». Clark admite fácilmente que no todas las visualizaciones son el producto de su genio del diseño. Son sus habilidades de programación las que le permiten construir motores que impulsan las visualizaciones. «Paso una buena cantidad de tiempo mirando lo que hay ahí fuera. Tomaré lo que alguien hizo visualmente y usaré una fuente de datos diferente. Twitter Spectrum se basó en cosas que la gente busca en Google. Chris Harrison hizo un trabajo interesante que se ve muy bien y pensé, puedo hacer algo así que se basa en datos en vivo. Así que lo traje a Twitter».

Sus herramientas son definitivamente etapas tempranas, pero incluso ahora, es fácil imaginar dónde podrían llevarse.

Tomar TwitterVenn. Introduce tres términos de búsqueda y la aplicación devuelve un diagrama venn que muestra la frecuencia de uso de cada término y la frecuencia de superposición de los términos en un solo tweet. Como bono, muestra un pequeño mapa de palabras de los términos más comunes relacionados con cada término de búsqueda; tweets por día para cada término por sí mismo y cada combinación de términos; y un tuit reciente. Entré en «Apple, Google, Microsoft». Esto es lo que un tiene:

twittervenn.jpg

Enseguida veo que los tuits de Apple están dominando, no es de extrañar. Pero observe la alta frecuencia de palabras inesperadas como «ganar» «libre» y «capacitivo» utilizado con el término «manzana». Eso sugiere marketing (¿spam?) de productos de Apple a través de Twitter, es decir, «Gana un iPad gratis…».

Me sorprendió la relativa infrecuencia de los tweets de «google». De hecho, en promedio hubo más tweets que incluían tanto «microsoft» y «google» que los que acaban de mencionar «google».

Entonces fui a Twitter Spectrum, una herramienta similar que compara dos términos de búsqueda y muestra qué palabras se asocian más comúnmente con cada término y qué palabras se usan más comúnmente en tweets con ambos términos. Aquí está el «google, microsoft» Twitter Spectrum:

twitterspectrum.jpg

Me encanta que la palabra «ugh» sea el centro muerto entre Google y Microsoft. Pero la prominencia de los términos de las redes sociales en el lado azul frente a los términos de búsqueda en el lado rojo es fascinante. Parece que dos ejércitos marchando uno contra el otro listos para luchar diferentes guerras.

Clark también ha creado Twitarcs. Creo que éste sigue siendo un trabajo en progreso y Clark dice «visualmente me gusta, pero podría ser el menos útil hasta ahora». En este caso, escribes el identificador de un tweeter y devuelve una secuencia de tweets de esa persona con arcos que vinculan palabras comunes entre tweets (a la derecha) y retweeters comunes (a la izquierda). Al pasar el ratón sobre resalta el último tweet en el arco. Aquí hay un TwitArc de @timoreilly:

twitarc.jpg

Por último, el gráfico de flujo. Introduce un término de búsqueda y el motor de Clark devuelve la frecuencia de las palabras más comunes encontradas con tu término de búsqueda para los últimos 1.000 tweets. Ves un flujo literal de conversación. También puedes resaltar un término para ver cómo cambió su frecuencia con el tiempo y verás los tweets más recientes que incluyen tanto el término de búsqueda como el término resaltado.

A veces 1.000 tweets con su término pueden durar semanas. Para mi término de búsqueda, «Tiger Woods» al que entré ayer por la tarde justo después de que la noticia de que él hablaría públicamente se rompió, 1.000 tuits cubrieron unos 20 minutos. Aquí está el gráfico de flujo «Tiger Woods» con «silencio» resaltado:

streamgraph.jpg

No es difícil imaginar cómo esto puede ser aplicable a los negocios. Ya puedo ver a los vendedores ansiosos viendo el flujo de corriente como sus debutos comerciales durante el Super Bowl del próximo año.

Clark, al igual que muchos visualizadores de datos, cree que estamos en el frente de una revolución en la presentación de información. «Hay mucho trabajo hecho llamado visualización científica o gráficos de inteligencia empresarial», dice. «Y es pragmático, tratando de resolver problemas prácticos. Todo es estándar, un gráfico de barras o un circular. Pero esas formas estándar no son adecuadas cuando intenta extraer un espacio de datos más rico. El mundo está lleno de datos complejos y estamos empezando a obtener las herramientas para darle sentido. Estamos buscando nuevas formas de presentar datos».


Escrito por
Scott Berinato




Eleva tus habilidades de liderazgo y negocios

Súmate a más de 52,000 líderes en 90 empresas mejorando habilidades de estrategia, gestión y negocios.