La inteligencia artificial abruma al mundo de los audiolibros

La inteligencia artificial ya comenzó a transformar el mundo de los audiolibros con la capacidad de generar locuciones fluidas sin utilizar un narrador humano, una novedad que preocupa a los profesionales de la voz.

(ARCHIVO) Una foto tomada el 8 de febrero de 2019 en París muestra un teléfono inteligente y sus auriculares mientras se reproduce un podcast de audio. Mientras la gente se prepara para el impacto disruptivo de la inteligencia artificial en los trabajos y la vida cotidiana, aquellos en el mundo de los audiolibros dicen que su campo ya se está transformando. La IA es capaz de crear grabaciones que suenan como las de un ser humano, a la velocidad de una cadena de montaje, prescindiendo al menos en parte de los servicios de los profesionales humanos que durante años se han ganado la vida con sus voces.
THOMAS SAMSON/AFP

Tanya Eby lleva veinte años dando voz a los textos a tiempo completo. En los últimos seis meses, sus pedidos se han reducido a la mitad y la actividad de muchos de sus colegas también ha mermado.

"Parece lógico que la inteligencia artificial nos esté afectando", dice. "Creo que es el plan para el futuro: reemplazar trabajadores y reducir costos".

No hay un sello para identificar la IA, pero según varios profesionales del sector, ya circulan en el mercado miles de audiolibros concebidos a partir de bancos de datos vocales.

Entre los programas más avanzados, DeepZen ofrece un precio básico que puede reducir a la cuarta parte el costo de creación de un audiolibro en comparación con un proyecto clásico.

Esta pequeña empresa con sede en Londres trabaja con una base de datos que ella misma creó grabando las voces de varios actores a los que se les pidió que expresaran una variedad de emociones diferentes.

"Hemos firmado un acuerdo de licencia con todas las voces que utilizamos", dice Kamis Taylan, gerente general de DeepZen. "Pagamos por las grabaciones (...) y pagamos regalías cada vez que usamos la voz para un proyecto".

"Las cosas evolucionan tan rápido que hay muchos recién llegados que no tienen la misma ética" y usan voces sin remunerar a sus dueños, advierte Tanya Eby.

"Hay una zona gris" que aprovechan muchas plataformas, explica Kamis Taylan. "Toman tu voz, la mía y cinco más, crean una nueva voz y no pagan nada, dicen que no es de nadie".

Todas las empresas contactadas por la AFP se defienden de tales prácticas.

La start-up texana Speechki propone, además de utilizar sus propias grabaciones, utilizar voces extraídas de bancos de datos existentes, refiere su director general, Dima Abramov.

Esta segunda opción requiere la firma de un contrato que incluye los derechos de uso, explica.

Conexión emocional

Consultadas sobre el tema, las cinco principales editoriales del mercado estadounidense no respondieron.

Pero según profesionales entrevistados por AFP, varios nombres del sector editorial tradicional ya utilizan la llamada IA generativa, es decir capaz de crear, sin intervención humana, textos, imágenes, videos o voces, a partir de contenidos existentes.

"La narración profesional siempre ha sido esencial para escuchar en Audible y seguirá siéndolo", dijo una portavoz del gigante estadounidense de los audiolibros, filial de Amazon.

"Dicho esto, a medida que la tecnología mejora, visualizamos un futuro en el que la interpretación humana y el contenido generado (con IA) pueden coexistir".

Muy volcados a inteligencia artificial, los gigantes tecnológicos están involucrados en la floreciente economía de los audiolibros generados por software.

A principios de año, Apple lanzó una oferta de "narración digital", destinada, según la compañía, a "hacer que la creación de audiolibros sea más accesible para todos", en particular "para autores independientes y pequeñas editoriales".

Google ofrece un servicio similar, descrito como "autonarración".

"Necesitamos democratizar la industria editorial, porque en este momento solo los nombres más conocidos se convierten en audiolibros", sostiene Kamis Taylan.

"La narración sintética acaba de abrir la puerta a todos los libros existentes que no han sido grabados y a todos los libros futuros que nunca se grabarían debido a limitaciones económicas", dice Dima Abramov, que estima que actualmente 5% de los libros se convierten en audiolibros.

Este crecimiento del mercado también beneficiará a los actores de voz, añade. "Harán más grabaciones y ganarán más dinero".

"Contar historias, en esencia, es permitir a los humanos reconectarse con su humanidad", estima Emily Ellet, directora de la Asociación de Narradores Profesionales de Audiolibros (PANA). "La narración debe seguir siendo completamente humana".

Para Tanya Eby, la narración de IA aún "carece de conexión emocional. Hay una diferencia real (con las grabaciones clásicas). Pero con el tiempo, los oyentes pueden acostumbrarse".

"Me gustaría que las empresas hicieran saber a los oyentes que están escuchando una pieza generada por IA", dice. "Que sean honestos al respecto". Recuerde conectarse con la señal en vivo de la HJCK, el arte de escuchar.

"