Mostrando entradas con la etiqueta libro. Mostrar todas las entradas
Mostrando entradas con la etiqueta libro. Mostrar todas las entradas

martes, 15 de mayo de 2018

IA: Algoritmo distingue libros por sus tapas

Red neuronal profunda aprende a juzgar libros por sus cubiertas

Un algoritmo de visión artificial puede distinguir el género de un libro mirando su portada. Esto allana el camino para que los sistemas de IA diseñen las cubiertas por sí mismos.
por Emerging Technology del arXiv


El modismo "nunca juzgues un libro por su portada" advierte contra la evaluación de algo puramente por la forma en que se ve. Y, sin embargo, las portadas de los libros están diseñadas para darles a los lectores una idea del contenido, hacer que quieran tomar un libro y leerlo. Las buenas portadas de libros están diseñadas para ser juzgadas.

Y los humanos somos bastante buenos en eso. Es relativamente sencillo elegir un libro de cocina o una biografía o una guía de viaje con tan solo mirar la portada.

Y eso plantea una pregunta interesante: ¿las máquinas también pueden juzgar los libros por sus cubiertas? Ya sabemos que juzgan a las personas por sus tapas.




Hoy recibimos una respuesta gracias al trabajo de Brian Kenji Iwana y Seiichi Uchida en la Universidad de Kyushu en Japón. Estos chicos han entrenado una red neuronal profunda para estudiar portadas de libros y determinar la categoría de libro de donde provienen.

Su método es directo. Iwana y Uchida descargaron 137.788 portadas de libros únicos de Amazon.com junto con el género del libro. Hay 20 géneros posibles, pero cuando un libro se incluyó en más de una categoría, los investigadores utilizaron solo el primero.

Luego, el par usó el 80 por ciento del conjunto de datos para entrenar una red neuronal y reconocer el género mirando la imagen de portada. Su red neuronal tiene cuatro capas, cada una con hasta 512 neuronas, que juntas aprenden a reconocer la correlación entre el diseño de la portada y el género. El par usó otro 10 por ciento del conjunto de datos para validar el modelo y luego probaron la red neuronal en el 10 por ciento final para ver qué tan bien categoriza las cubiertas que nunca ha visto.

Los resultados hacen una lectura interesante. El algoritmo enumeró el género correcto en sus tres opciones principales más del 40 por ciento del tiempo y encontró el género exacto más del 20 por ciento del tiempo. Eso es significativamente mejor que el azar. "Esto muestra que la clasificación de diseños de portadas de libros es posible, aunque es una tarea muy difícil", dicen Iwana y Uchida.

Algunas categorías resultan más fáciles de reconocer que otras. Por ejemplo, los libros de viaje y libros sobre computación y tecnología son relativamente fáciles de detectar para la red neuronal porque los diseñadores de libros usan consistentemente imágenes y diseños similares para estos géneros.

La red neuronal también descubrió que los libros de cocina eran fáciles de reconocer si usaban imágenes de alimentos, pero eran completamente ambiguos si usaban un diseño diferente, como una imagen del chef.

Las biografías y las memorias también eran problemáticas y el algoritmo a menudo seleccionaba la historia como categoría. Curiosamente, para muchos de estos libros, la historia es el género secundario enumerado en Amazon, lo que sugiere que el algoritmo no fue engañado por completo.

El algoritmo también confundió los libros para niños con cómics y novelas gráficas, así como libros de medicina y libros de ciencias. Quizás eso también es comprensible dadas las similitudes entre estas categorías.

Hay una falla en este trabajo. Iwana y Uchida no han comparado el rendimiento de su red neuronal con la capacidad de los humanos de reconocer los géneros de los libros por sus portadas. Eso sería un experimento interesante y uno que sería relativamente sencillo de hacer con un servicio de crowdsourcing en línea como Amazon Mechanical Turk.

Hasta que se haga ese trabajo, no hay forma de saber si las máquinas son mejores en esta tarea que los humanos. Aunque, sin importar lo buenos que sean los humanos en esta tarea, seguramente es sólo cuestión de tiempo antes de que las máquinas los superen.

Sin embargo, este es un trabajo interesante que podría ayudar a los diseñadores a mejorar sus habilidades cuando se trata de portadas de libros. Un resultado más probable, sin embargo, es que podría usarse para entrenar máquinas para diseñar portadas de libros sin necesidad de aportes humanos. Y eso significa que el diseño de la portada del libro es solo otro trabajo que se asignará a los libros de historia.

miércoles, 16 de marzo de 2016

Cómo se leen los libros y un estudio de mercado muy particular

Moneyball para Editores de Libros: Vista detallada cómo leemos
Por Alexandra Alter y Karl Russel - New York Times


El porcentaje de lectores que han terminado de leer cada capítulo de tres libros electrónicos específicos.
Cómo la gente lee una exitosa novela de EE.UU. ... Una no tan exitosa ...... Y una que tuve su marketing recortado.


Un análisis realizado por Jellybooks de cómo los lectores leen libros electrónicos encontró que una vez que la mayoría de la gente hace más allá de los primeros 50 a 100 páginas que suelen terminar el libro. Pero no todo el mundo llega tan lejos.


Andrew Rhomberg quiere ser el Billy Beane del mundo del libro.

El Sr. Beane utilizó la analítica para transformar el béisbol, como es sabido se relata en "Moneyball", un libro de Michael Lewis. Ahora el señor Rhomberg quiere utilizar datos sobre los hábitos de lectura de la gente para remodelar radicalmente la forma adquieren los editores, editar y comercializar libros.

"Todavía no sabemos casi nada acerca de los lectores, sobre todo en las publicaciones comerciales," dijo el Sr. Rhomberg, el fundador de Jellybooks, una empresa de análisis del lector con sede en Londres.

Mientras que los minoristas de libros electrónicos como Amazon, Apple y Barnes & Noble pueden recoger troves de los datos sobre el comportamiento de la lectura de sus clientes, editores y escritores se encuentran todavía en la oscuridad acerca de lo que realmente sucede cuando los lectores tomar un libro. ¿La mayoría de la gente lo devoran en una sola sesión, o hacer la mitad de los lectores renunciar tras el capítulo 2? Las mujeres de más de 50 más probabilidades de terminar el libro que los hombres jóvenes? ¿Qué pasajes que ponen de relieve, y que no se saltan?

La empresa del Sr. Rhomberg está ofreciendo a los editores la tentadora posibilidad de interconexión para ver por encima de los hombros de los lectores. Jellybooks rastrea el comportamiento de la lectura de la misma manera Netflix sabe lo que muestra binge-reloj y Spotify sabe qué canciones son las más escuchadas.

Así es como funciona: la compañía da a libros electrónicos gratuitos a un grupo de lectores, a menudo antes de su publicación. En lugar de pedir a los lectores a escribir una crítica, se les dice que hacer clic en un enlace incluido en el e-libro que va a cargar toda la información que el dispositivo ha registrado. La información muestra Jellybooks cuando la gente lee y por cuánto tiempo, en qué medida se ponen en un libro y la rapidez con que leen, entre otros detalles. Se asemeja a la forma en Amazon y Apple, mirando los datos almacenados en los dispositivos de lectura electrónica y aplicaciones, se pueden ver con qué frecuencia se abren los libros y hasta qué punto en un libro los lectores reciben.

Jellybooks ha ejecutar pruebas en cerca de 200 libros durante siete editores, uno de los principales editores de América, tres editores británicos y tres casas alemanas. La mayoría de los editores no querían ser identificados, para evitar alarmar a sus autores. La compañía normalmente recoge datos de lectura de los grupos de 200 a 600 lectores.

El Sr. Rhomberg dio recientemente un taller en Digital Mundial del Libro, en una conferencia de la publicación en Nueva York, y algunos de sus hallazgos confirmaron los peores temores de los editores y los autores.

En promedio, menos de la mitad de los libros analizados fueron terminados por la mayoría de los lectores. La mayoría de los lectores suelen dar para arriba en un libro en los primeros capítulos. Las mujeres tienden a dejar de fumar después de 50 a 100 páginas, los hombres después de 30 a 50. Sólo el 5 por ciento de los libros Jellybooks probados fueron completados por más del 75 por ciento de los lectores. El sesenta por ciento de libros cayó en un intervalo en el 25 por ciento a 50 por ciento de los lectores de ensayo acabó con ellos. Los libros de negocios tienen tasas de terminación sorprendentemente bajos.

¿Cómo serán los editores utilizan los datos?

En su mayor parte, los editores que están trabajando con Jellybooks no están utilizando los datos de reformar radicalmente los libros para hacerlos más atractivos, a pesar de que podrían hacer que con el tiempo. Pero algunos están utilizando los resultados para dar forma a sus planes de marketing. Por ejemplo, un editor Europea redujo su presupuesto de marketing para un libro que había pagado mucho dinero para adquirir después de enterarse de que el 90 por ciento de los lectores se rindió después de sólo cinco capítulos. Un editor alemán decidió aumentar la publicidad y comercialización en una novela negra debut luego de que datos mostraron que casi el 70 por ciento de los lectores lo terminó.

Los editores también pueden utilizar los datos para aprender qué tipo de lector de un libro apela a, y el mercado en consecuencia. Una de las novelas que Jellybooks probado fue escrito para los adolescentes, pero resultó sorprendentemente popular entre los adultos.

¿Por qué esto puede asustar a los autores?

Los autores son comprensiblemente nervioso acerca de cómo los nuevos conocimientos sobre el comportamiento de lectura pueden influir en las decisiones editoriales de los editores. Supongamos que usted está escribiendo una serie de crimen, y los lectores renunció a mitad de camino a través de la última entrega. Los editores podrían no querer comprar el siguiente. ¿Y si los lectores se saltan alrededor en su libro de no ficción, una forma común de leer no ficción? Un editor puede querer cortar los capítulos personas están saltando, lo que podría borrar contexto útil.

Y, por supuesto, las personas que se inscriban para un servicio de e-libro libre podrían no representar los tipos de lectores que buscar y pagar por una novela negra, o un libro de no ficción sobre un tema que les interesa. Los tamaños de las muestras son relativamente pequeñas. Por lo que los datos del lector podrían no representar las reacciones del público en general.

¿Por qué esto podría ser problemático para los lectores?

Jellybooks usuarios consienten que sus datos de seguimiento a cambio de libros gratuitos y, deben hacer clic en un enlace para enviar esos datos a Jellybooks. "Es absolutamente crítico para que el usuario en el control, o nos enfrentamos a una reacción violenta", dijo Rhomberg en la conferencia.

Pero a medida que la industria del libro se vuelve más sofisticada acerca de cómo medir el comportamiento de la lectura y la práctica se hace más generalizada, problemas de privacidad reales podrían surgir. Algunos grandes editoriales académicas ya realizar un seguimiento de cómo los estudiantes leen sus libros electrónicos, y algunos servicios de suscripción de libros electrónicos han desarrollado la capacidad de medir el compromiso lector. lectores de libros electrónicos regulares no se dan cuenta de que los minoristas digitales están registrando y almacenando los datos. Hace algunos años, California instituyó el "acto lector de privacidad", lo que hizo posible que los organismos encargados de hacer cumplir la ley para reunir información sobre los registros de lectura digital de los consumidores en tiendas de libros electrónicos. Pero la mayoría de los otros estados no han tomado tales medidas.

Sin embargo, tener empresas leyendo por encima de su hombro es probablemente inevitable

Analytics están transformando todos los rincones del mundo de los medios. La edición digital no puede estar muy lejos en la medición del comportamiento del consumidor. Como el Sr. Rhomberg decirlo sin rodeos en Digital Mundial del Libro, las cifras de ventas no son suficientes para medir el éxito de un libro. "Pregúntese," dijo a la audiencia. "¿Estás en el negocio de venta de papel?"

martes, 13 de agosto de 2013

miércoles, 7 de noviembre de 2012

Twitter Delicious Facebook Digg Stumbleupon Favorites More

 
Design by Free WordPress Themes | Bloggerized by Lasantha - Premium Blogger Themes | Best Hostgator Coupon Code