Skip to content

Solidaridad y renta en la campaña de recogida de alimentos

Hace unos días desde La Vanguardia nos pidieron que analizáramos los datos de kilogramos de alimentos recogidos en supermercardos de Barcelona durante la campaña del Gran Recapte organizada por el Banc dels Aliments. En esta ocasión, quisimos cruzar esos datos con los datos de niveles de renta de cada uno de los barrios de Barcelona para ver si, en términos relativos, existía diferencia entre la cantidad de alimentos recogida en los barrios con rentas mayores y menores.

De forma muy breve, en un primer análisis observamos el volumen de kilogramos por bañera (es el nombre que recibe el contenedor que hay en cada establecimiento que participa en la campaña) recogidos en cada barrio, dado que el número de bañeras existente en cada barrio no era homogéneo ni proporcional a la población, de hecho, en los barrios más ricos había un mayor número de bañeras, con lo que este ratio era el que proporcionaba un análisis menos sesgado. Posteriormente calculamos el puesto que tenía cada barrio sobre la media (100) de Barcelona y comparamos ese ranking con el que ocupaba cada barrio en el ranking de renta sobre la media (100) de Barcelona. Establecimos una comparativa entre esos dos rankings, viendo si cada barrio estaba por encima o por debajo en el caso de los alimentos recogidos en relación a su puesto en renta, para ver si realizaban un esfuerzo superior o inferior a lo que supuestamente les podría corresponder por renta. Los resultados los representamos sobre el mapa de barrios de Barcelona con Google Fusion Tables:

En este otro mapa, se pueden observar en términos absolutos los kilogramos recogidos por bañera en cada uno de los barrios de Barcelona en los que hubo establecimientos que participaron en la campaña.

Mientras que en el primer caso, se observa cómo los barrios con rentas más bajas hacen una aportación por encima de lo que supuestamente por ese nivel de renta les correspondería, en el segundo se ve claramente cómo los barrios más ricos son de los que más kilogramos por bañera acaban donando, aunque también se puede apreciar la gran cantidad de kilogramos por bañera recogidos en algunos barrios con niveles de renta inferiores como la Prosperitat u Horta.

El calzado como termómetro de la crisis

Hace unos meses podíamos leer una nota de prensa de IBM en la que la empresa norteamericana presentaba un estudio, basado en el análisis de millones de mensajes a través de redes sociales y blogs, en el que se identificaba un descenso en la altura de los tacones como tendencia asociada a la crisis económica. Fruto de esa noticia, en The Data Republic nos hemos preguntado si se podía contrastar para España esa hipótesis de cambios de preferencias en el calzado debidos a la crisis económica. Para ello, hemos procedido a extraer y analizar más de 30.000 looks subidos a Chicisimo por usuarias españolas en 2011 y en lo que llevamos de 2012.

La primera hipótesis a contrastar era clara: si la crisis ha propiciado que los usuarios de las webs de street style opten por zapatos más baratos. Entendiendo que comprar zapatos más baratos puede significar el vestir tipos de calzado más asequibles o bien comprar marcas más baratas.

Respecto a lo primero, si analizamos la web de Zara, con diferencia la marca de moda más vendida en España y también con mayor presencia en Chicisimo, vemos cómo botas y botines son el calzado con un precio medio más elevado, por encima de los zapatos de tacón, y de entre los dos primeros, las botas son más caras que los botines. Pues bien, si vemos qué tipo de calzado es el más habitual entre los looks subidos en los periodos de enero a marzo de 2011 y de 2012, observaremos cómo tacones y botines han crecido ligeramente mientras que botas y botas sobre la rodilla han descendido, al igual que zapatos planos y sandalias de gladiador. Si bien en ambos años el dominio de los zapatos de tacón es claro, mientras en 2011 las botas se situaban por encima de botines como segundo tipo de calzado más utilizado, en 2012 las tornas han cambiado.

Primer dato relativo a tipos de calzado que puede contribuir a confirmar la hipótesis del impacto de la crisis: las botas, el calzado generalmente más caro, han perdido cuota entre los looks que visten los usuarios de Chicisimo. Segundo dato: se ha producido un desplazamiento de la bota hacia el botín, un tipo de calzado que tiene de media precios más bajos, como se puede ver en Zara.

Read more

Streaming Twitter API, Big Data and AC Milan vs FC Barcelona

These days we are working on a project based on monitoring of tweets through the Twitter Streaming API. This API allows you to open a connection to Twitter and start receiving tweets that meet the search criteria, in our case containing certain keywords. Using this API we can get all the tweets published on Twitter. The standard API  search does not offer all tweets, it is rate limited and it is not in true real time.

At this stage of project development, we need to perform several tests, mainly to assess whether the system we’re designing is capable of processing large amounts of data (tweets) per second.

On the occasion of the Champions League match AC Milan vs FC Barcelona, we thought that this might be a good opportunity to monitor different keywords associated with the game. During the match, 30 minutes before and 30 minutes after, we opened a streaming connection to the Twitter API to read all the tweets with these keywords:

milanbarça, milanbarcelona, forçabarça, forzamilan, milan-barça, milan-barcelona, milan-barca, milan-fcb, milan vs barça, milan vs barcelona, milan vs barca, messi, ibrahimovic

To perform this monitoring, we developed a small console application written in C # and based on this code written by Shannon Whitley (@swhitley). We stored the tweets in a Microsoft SQL Server database. For this test we decided not to use MSMQ queues.

The result was great and we stored in our database 83,582 tweets during the 172 minutes that the connection to the Twitter API was open, which means an average of 8.09 tweets per second.
Read more

¿Qué trabajos genera el turismo en Barcelona?

Hoy Xavier Trias hablaba sobre la importancia del turismo para Barcelona, cifrando en un 16% el peso de este sector sobre el PIB de la ciudad. El peso del turismo sobre la ocupación no está tan claro. Por un lado, la hostelería supone alrededor del 7% (4º trimestre 2011) de los puestos de trabajo de la ciudad, mientras que el comercio (que en parte está directamente relacionado con el turismo) da trabajo al 15% de los ocupados. Así pues,  casi una cuarta parte de los puestos de trabajo de la ciudad son principalmente hoteles, bares, restaurantes y comercios.

El papel del turismo en el modelo productivo de Barcelona es un tema que está últimamente sobre la mesa, a raíz de la crisis y de las elevadas tasas de paro, pero también por el ahínco con el que el gobierno municipal está promocionando la capitalidad mundial del móvil para Barcelona y el supuesto efecto que va a tener como palanca hacia un cambio de modelo económico basado en sectores de mayor productividad y valor añadido.

En relación al turismo y la ocupación en Barcelona, desde The Data Republic nos hemos preguntado qué tipo de perfiles profesionales son actualmente más demandados por las empresas de este sector, qué formación piden a los candidatos o qué tipo de contratos ofrecen. Queríamos saber qué tipo de puestos de trabajo son los que se están generando en una de las principales industrias de la ciudad. Para ello, hemos analizado todas las ofertas de trabajo publicadas actualmente en Infojobs dentro del sector turismo y restauración, un total de 319, que representan alrededor del 5% de todas las ofertas publicadas para la provincia de Barcelona. Un porcentaje bastante bajo que con toda seguridad se explica por la característica estacionalidad de este sector. La semana que viene es Semana Santa y la mayor parte de las contrataciones deberían estar ya cerradas.
Read more

Meet the Republic of Data 2.0

The guys from Bvisió made this great video (in Catalan) about The Data Republic. We really appreciate the chance to introduce ourselves and our work through their website.

We introduce the new Flickr Tourism Indicator 2011 for Madrid and Barcelona

Some months ago we developed a project on tourist behavior patterns in Barcelona based on the extraction and analysis of geotagged pics uploaded to Flickr by tourists visiting Barcelona. Following that idea, now we have built the Flickr Tourism Indicator 2011.

With this indicator, we want to contribute to identify certain behavior patterns that might be interesting to evaluate the location of new businesses, to better target tourism services or just to improve the mobility and signalization of touristic spots. But this should be as well an interesting way to measure the impact of tourism over cities, not just over the economy but over their public spaces, on the quality of life of their neighborhoods and also their neighbors. We aim to help businesses and organizations in the tourism industry and cities that receive every year millions of visitors who move around their monuments, streets and buy at their shops. Now, we have launch a beta version of the Flickr Tourism Indicator 2011 for Madrid and Barcelona, but we are already working so, very soon, we can incorporate to the indicator some other cities such as New York, London or Paris.

The Flickr Tourism Indicator by The Data Republic stands out as a new, quantitative, objective and smart way to compare the touristic performance and success of different cities, different city’s areas or different tourist attractions, as well as to measure the impact of tourism over cities. That’s smart tourism for smart cities.

Take a look and play with filters and maps!

Video of our workshop on data extraction at Medialab-Prado

Last Thursday 12th of January, we were invited to participate in a workshop held by the Medialab-Prado’s Data Journalism Workgroup. We had the chance to introduce The Data Republic to the audience and we discuss a little bit about how we extract data from social networks such as Flickr or Twitter. We really thank the organizers for inviting us and for the great job they are doing.

You can watch the full workshop here.

 

Data 2.0 as an indicator to launch new tourism products

Cities, regions and travel-related businesses such as hotels or travel agencies are constantly looking for a way to differentiate from their competitors in order to attract new tourists, within an industry where the price factor is many times key for consumers to decide for a destination, a hotel or a travel package.

In addition to this, regions usually depend too much on certain destinations, lacking of diversification and therefore experiencing concentration of tourists in a few cities or even on a single one. That is the case of Catalonia, where Barcelona represents more than 50% of all the tourist pernoctations in Catalonia. Moreover, most of the tourists that visit some other places in Catalonia, usually visit Barcelona as well.

Therefore, we find that tourism  institutions need to put into value new destinations, in order to spread the profits and the impact of tourism all around their territory. Similarly, tourism businesses need to increase their competitiveness, by launching new products to diversify their portfolio and attract new customers.

In this context, data 2.0 appears as a new way to better understand tourist preferences. In our new project, Flickr stands out as an indicator that can show us what places within a region tourists like to visit the most, depending on the season or their nationality for example. Through this analysis, any business can offer new and demand-adapted travel packages to their customers.  Additionally, institutions can access to data about tourists travelling around their regions, something they usually lack, because many times these visits are simple getaways of one day, wihout hotel pernoctations. Again, data 2.0 happens to be an effective way to complement available data 1.0 or even to analyze preferences and habits where data 1.0 fails to do it.

With Barcelona’s tourists travelling around Catalonia, we have wondered where tourists visiting Barcelona like to go somewhere else in Catalonia, depending on the time of the year. This information aims to help all tourism business and institutions to better understand their current and potential customers.

Take a look at this project.

 

Buscando algunas respuestas a datos sobre un mapa

En estos días, muchos medios publican noticias en las que se muestra el porcentaje de voto en las pasadas elecciones generales por barrio o incluso por sección censal. Es el caso de BTV Notícies, que esta semana colgaba en su web el mapa de Barcelona con los resultados electorales por sección censal.

Más allá de este tipo de análisis, resulta también de interés fijarse en aquellos datos que destacan por ser menos previsibles y ver si pueden decirnos algo más sobre las personas que viven en una determinada zona de una ciudad. En el caso de Barcelona, el color predominante en las distintas secciones censales de la ciudad es el azul (de CiU) y el rojo (del PSC), en la mayoría de los casos de acuerdo a los patrones de voto ya habituales. Sin embargo, si se observan las menos numerosas manchas en azul celeste (que corresponden al PP), se puede ver una sección totalmente aislada en el barrio de la Nova Esquerra de l’Eixample, en la manzana delimitada entre las calles Valencia, Vilamarí, Llança y Avenida de Roma. En esa sección censal, el PP fue el partido más votado con más de un 40% de los votos, dato que resulta sorprendente, sobre todo porque en las secciones que la envuelven, el porcentaje de votos del PP está alrededor del 20% de media.

 

¿Por qué ese resultado tan significativo y aislado en ese lugar? Pues bien, si nos fijamos con mayor detalle en esa manzana, veremos que ahí precisamente se ubicaba antiguamente un cuartel del Ejército y que, en la actualidad, el Ministerio de Defensa es propietario de numerosos pisos en varios edificios de esa sección censal, los cuales están habitados por personal vinculado al Ejército español.

Últimamente es muy habitual encontrar mapas, tablas, infografías y miles de datos representados de formas muy interesantes, pero no debemos quedarnos en el simple hecho de observar si intentar mirar más allá, ya que toda esa información  nos puede aportar datos de mucho valor. Nuestro gran reto es generar valor a través del análisis de los datos públicos. Para nosotros, visualizar datos no es simplemente una forma estética de representarlos, sino una forma esencial de analizarlos y obtener conclusiones que sean de valor para las empresas. Detrás de los votos hay personas y territorio, detrás de los datos hay información sobre esas personas (consumidores) y ese territorio (mercado).

#TodayImWearing

The @hm twitter channel sometimes invites its followers to share their outfits with them using the #TodayImWearing tag. This morning we are monitoring the fashionistas who are sharing their outfits using this tag.

Here are the results of what they are wearing today:

Last update: 3:30pm (Barcelona timezone)

 

Related posts:

Analyzing Twitter followers: Let us tell you a little bit about your customers

Mango’s clothes on the streets