La minería de datos permite a las ciudades grandes que se clasifican de acuerdo a su "atractivo", dicen los investigadores en desarrollo una nueva ciencia de las ciudades.
La capacidad de cualquier ciudad para atraer a los visitantes es una métrica importante para urbanistas, empresas basadas en el turismo, los planificadores de tráfico, residentes, y así sucesivamente. Y hay cada vez más variadas formas de medir esto gracias a los crecientes volúmenes de datos relacionados con la ciudad-generados por los medios sociales, y los datos basados en la localización.
Así que es natural que los investigadores les gustaría dibujar estos conjuntos de datos en conjunto para ver qué tipo de visión que pueden obtener de esta forma de fusión de datos.
Y así ha resultado gracias a la obra de Stanislav Sobolevsky en el MIT y unos amigos. Estos chicos han fusionado tres conjuntos de datos muy diferentes relacionados con el atractivo de una ciudad que les permite ocupan estos lugares y para comprender por qué las personas los visitan y lo que hacen cuando llegan allí.
El trabajo se centra exclusivamente en las ciudades de España a partir de datos que es relativamente sencillo de reunir. El primer conjunto de datos consiste en el número de transacciones de crédito y débito realizadas por los visitantes a las ciudades en toda España durante el año 2011. Esto incluye únicamente para cada tarjeta de origen, lo que permite Sobolevsky y coautores contar sólo aquellas transacciones realizadas por extranjeros visitantes, un total de 17 millones de transacciones anónimos de 8,6 millones de visitantes extranjeros procedentes de 175 países diferentes.
El segundo conjunto de datos se compone de más de 3,5 millones de fotos y videos tomados en España y enviado a Flickr por personas que viven en otros países. Estas fotos fueron tomadas entre 2005 y 2014 por 16.000 visitantes de 112 países.
El último conjunto de datos se compone de alrededor de 700 mil tuits con etiquetas geográficas publicadas en España durante el año 2012. Estos fueron publicados por 16.000 visitantes extranjeros de 112 países.
Finalmente, el equipo define el atractivo de una ciudad, por lo menos para los fines de este estudio, ya que el número total de fotos, tweets y las transacciones con tarjetas que tuvieron lugar dentro de ella.
Este nivel de actividad de los visitantes conduce a una clasificación simple, pero que obviamente necesita ser normalizado por el tamaño de la ciudad. Y eso lleva a una interesante pregunta, ¿cómo el nivel de visitantes escala de actividad con el tamaño de la ciudad?
A primera vista, es fácil imaginar que la actividad del visitante debe escalar linealmente con el tamaño de la ciudad. Las ciudades más grandes atraen más visitantes que en conjunto son más activos.
Pero los antropólogos han sabido por mucho tiempo que los diferentes aspectos de la vida de la ciudad a escala de diferentes maneras. Por ejemplo, el número de empleos, casas, y el consumo de agua durante todo el escalar linealmente con el tamaño de la ciudad. Otras cosas escalan menos rápidamente o sublinearly con el tamaño de la ciudad como zona de superficie de la carretera. Y aún otras cosas escalar más rápidamente o superlinearly, tales como los ingresos y la productividad, así como la contaminación y la pobreza.
Entonces, ¿cómo escala actividad de los visitantes con el tamaño de la ciudad? Superlinearly, decir Sobolevsky y colegas. Las ciudades más grandes no sólo atraen a más visitantes, pero los más activos, así-que toman más fotos, tweets más a menudo, y el uso de sus tarjetas de crédito y débito con más frecuencia. "Ciudad atractividad fue encontrado para demostrar una fuerte escala superlineal con el tamaño de la ciudad", dicen los investigadores.
Habiendo identificado esta tendencia, el equipo luego buscar excepciones y tratar de explicar por qué algunas ciudades se desvían. Por ejemplo, las ciudades de Málaga y Alicante tienen los niveles relativos más altos de transacciones con el exterior, pero entre la actividad más bajo Flickr.
Sobolevsky y colegas dicen estas ciudades son bien conocidos como lugares de retiro populares para las personas mayores de toda Europa. "Parece bastante probable que los visitantes de esta categoría pueden ser típicamente usuarios mucho menos activas de Flickr", dicen.
Las ciudades de la isla de Santa Cruz de Tenerife y Las Palmas se encuentran en una situación similar. Ellos disfrutan de mucha actividad a las transacciones financieras, pero significativamente menor de lo esperado la actividad de Twitter y Flickr. Al parecer, los visitantes de estas ciudades están dispuestos a pasar, pero no para grabar su actividad con fotos y tweets.
Otra curiosa excepción es la ciudad de Badajoz, una ciudad del interior cerca de la frontera con Portugal, que tiene los niveles relativos más bajos de actividad de Twitter y Flickr de todas las principales ciudades de este estudio. Sobolevsky y coautores dicen que esto probablemente porque Badajoz no es una ciudad turística, sino un centro comercial. Así que la mayoría de los visitantes extranjeros tienden a haber cruzado la frontera de Portugal, para ir de compras y pasar poco tiempo twitteando o tomar fotos durante sus visitas.
Eso es un trabajo interesante que muestra cómo la fusión de grandes conjuntos de datos puede proporcionar ideas sobre la forma de utilizar las ciudades. Tiene sus limitaciones de curso. El estudio no aborda las razones por las cuales las personas encuentran atractivas ciudades y lo que les atrae allí en primer lugar. Por ejemplo, ¿están ahí para el turismo, por negocios o por alguna otra razón. Eso requeriría datos más especializados.
Pero sí proporciona una visión general de atractivo que podría ser un comienzo para análisis más detallados. Como tal, este trabajo es sólo una pequeña parte de una nueva ciencia de las ciudades en base a datos grandes, pero que muestra cuánto se está convirtiendo en posible con sólo un poco de procesamiento de números.
Ref: arxiv.org/abs/1504.06003 : Scaling of city attractiveness for foreign visitors through big data of human economic and social media activity