Páginas

lunes, 15 de julio de 2024

Cómo estoy potenciando mis podcasts con IA

  

Mis cuentos narrados en Spotify van por su cuarta temporada y mucha gente me ha estado diciendo que se escuchan cada vez mejor. ¿Sabían que en gran parte se debe a la inteligencia artificial? En esta nota, les detallo cómo estoy potenciando mis podcasts con IA.


 


***

Grabar y editar con Audacity

Este post va a ser un poquito la cocina de cómo produzco los podcasts de Cuentos de Luciano Sívori. Decidí comencé a grabar mis propios textsos allá por 2022,  luego de un viaje a Puerto Madryn. Venía pensándolo hace un montón y aquella aventura de playas y dinos (que estuvo tremenda, por cierto) terminó por definirme.

Me pareció que grabar los cuentos sería una forma divertida de difundir mi arte. Al ciudadano promedio hoy le da mucha paja leer y he notado que hay mucho más enganche con relatos narrados tipo radio-teatro. Son cortitos e ideales para esas tediosas tardes de oficina o largos viajes en la ruta.

El problema era que no sabía bien cómo arrancar. La primera temporada la hice medio al tun-tun… como pude, a los porrazos. Improvisando mucho y sin demasiada teoría. Investigué un poquito y terminé eligiendo Audacity para grabar y editar. Usé el micrófono de mis parlantes del laburo, lo cual fue un error.




En este sentido, la primera temporada -que se compone de doce episodios- me parece una picardía porque tiene algunos de mis mejores textos, pero la calidad de sonido y el resultado final no son los óptimos. Tengo ganas, en algún momento, de volver a grabar toda esa tirada de capítulos. 

Hoy, algunos años después, puedo decir que he mejorado muchísimo y mis seguidores (por suerte) lo están notando.

El primer gran avance de calidad fue comprar un buen micrófono podcastero. Elegí un Redragon que funciona re bien y empecé a utilizarlo a partir de la segunda temporada. Luego, el desafío fue ir mejorando mis técnicas y conocimientos de Audacity.

Siento que con cada cuentito aprendo alguna cosita nueva. Agrego efectos, música, edito el ritmo, grabo los diálogos (sean los míos o de algún compa invitado). Por lo general, un relato de 10-15 minutos me puede llevar hasta cuatro horas de producción… 

Así se ve el archivo de un texto en proceso de edición:



Pero además de mejorar en mis habilidades con la herramienta y trabajar en mi oratoria, también comencé a apoyarme un montón en algunas aplicaciones sencillas de Inteligencia Artificial.

Es tremendo cómo los creadores de contenido podemos ayudarnos para mejorar la calidad, eficiencia y alcance de los podcasts con IA. Hay muchísimo para explorar en este nuevo mundo y yo siento que recién estoy con la puntita del iceberg. Vayamos por parte.

 

Ideogram para generación de imágenes

En la esta digital, la creación visual es fundamental para captar la atención y comunicar de manera efectiva. Todo entra por los ojos. Por eso comencé a explorar algunas herramientas para generar imágenes con IA. Las utilizo para el texto escrito en el blog y además para la miniatura del podcast que se ve en Spotify.

Uno de los mayores beneficios de los generadores de imágenes con IA es la creatividad ilimitada que ofrecen. Es clave aprender a usar bien los prompts y tener paciencia. Por ejemplo, no hubo forma de que Ideogram me entendiera que yo quería a un padre montando a caballito de su hijo para el cuento Benjamín está empapado, uno de mis favoritos. 

Me hacía cosas rarísimas como éstas:

 


Sin embargo, frecuentemente encuentro que me ahorra muchísimo tiempo y me permite lograr diseños muy locos. De hechos, tardo menos en generar una imagen a mi gusto que buscar alguna ya creada por Google Images. Por otra parte, te permite personalizar bastante los diseños (tamaño, proporciones, estilo, calidad, etc).

Ideogram (y otras apps similares) no solo facilitan la creación de contenido visual de alta calidad, sino que también están impulsando la innovación en múltiples sectores. Si aún no exploraron las ventajas de los generadores de imágenes con IA, ahora es el momento de hacerlo.

Me encantan, por ejemplo, las imágenes re flasheras de filósofos que me generó cuando promocioné mis notas sobre "Filosofía a la mano":



ElevanLabs para voces y efectos de sonido

En mi último cuento grabado, El antojo tardío, invité a una amiga a participar y el resultado fue impresionante. Hubo mucha magia de edición ahí, pero todavía creo que la experiencia humana en diálogos e improvisaciones, es insuperable.

Aquel cuento me parece clave en todo este contexto. La historia nos habla de un pibe que se descarga una app para reproducir la experiencia (digital) de la primera chica con la que estuvo. Tiene mucho de contemporáneo porque esas aplicaciones literalmente ya existen.

Yo vengo trabajando con ElevenLabs hace un tiempito ya. A veces necesito generar diálogos para papeles chiquitos en los cuentos y me termina sirviendo al pelo. De nuevo, hay que tomarse un tiempito para configurarlo bien y tener paciencia, porque a veces te arma cosas espantosas. Pero encontré que funciona muy bien para ciertas ocasiones y diálogos cortitos.

Prácticamente, todos mis últimos cuentos narrados tienen algún fragmento que grabé con voces creadas por Inteligencia Artificial. Esto fue especialmente importante en mi cuento El cadáver prematuro, por la temática que toca.



Este cuentito de sci-fi se inspira en una noticia reciente sobre Suiza aprobando el uso de unos sarcófagos modernos que permiten el suicidio asistido.

Acá participó mi amigo Marcelo de Erausquin, si bien también hice un uso intensivo (e intencional) de este generador de voces con IA. Me parece que funciona un montón porque, justamente, en el cuento estos sarcófagos son operados por una Inteligencia Artificial malvada.

Escuchen también La Iniciación, una historia que tengo sobre cultos y sus extraños rituales de ingreso. Necesitaba la voz del Susurrador, un líder que habla sólo en susurros, y logré generarla con los prompts de ElevenLabs. Me quedó medio español, pero el resultado es absolutamente impresionante. Todo Inteligencia Artificial.

ElevenLabs es todavía más útil para generar pequeños efectos de sonido típicos. Una caminata, un ronquido, una puerta de colectivo que se abre, un auto que se enciende. De nuevo: a veces te hace cosas nefastas y necesariamente tenés que jugar con los prompts hasta poder sacar algo potable. Pero si le encontrás la vuelta, ayuda una bocha.



ChatGPT para estructura y consideraciones musicales

La última herramienta de IA que vengo usando frecuentemente para potenciar mis podcasts es la vieja y confiable: ChatGPT.

¿Pueden creer que, en realidad, se empezó a volver popular el año pasado? Su popularidad estalló y hoy ya entendemos que es un nuevo cambio de paradigma en un montón de ámbitos.

ChatGPT lo uso muchísimo y para una variedad de cuestiones diferentes, no sólo para mis podcasts. Por ejemplo, hace un tiempito me invitaron a dar una charlita sobre “Comunicación Asertiva” en una Escuela de Liderazgo en mi ciudad… y lo usé para estructurar la presentación y saber qué temas no me podían faltar.

Después yo le metí mi toque y magia a la charla, claro. La decisión final del producto siempre termina siendo de un ser humano. Seleccioné algunas didácticas lúdicas, coloqué un videíto de Intensamente, armé una buena presentación con Powerpoint, etc.

Una parte importante en la producción de mis cuentos narrados es la música. Los relatos tienen un tema de intro y uno de ending que están temáticamente relacionados con el contenido del texto. A veces también suenan otras canciones en el medio.




Siempre trato de que sean elecciones conscientes y no aleatorias. ChatGPT me ha ayudado a buscar canciones o música adecuada para generar sensaciones específicas en cada momento. Sus beneficios realmente no tienen límites.

¿Y ustedes? ¿Están utilizando la Inteligencia Artificial para potenciar sus proyectos? ¡Los leo en los comentarios!

 

Pueden encontrar todos mis cuentos en Spotify:

https://open.spotify.com/show/1kf01qxrscrZ9EstRmsHhl

 

También es posible bancar mi proyecto donando un cafecito:

cafecito.app/viajarleyendo


***

 

=>> Otros posts sobre TECNOLOGÍA e INTELIGENCIA ARTIFICIAL en el blog: “Literatura y tecnología, un libro de Cecilia Bona”; “Las tres clases de futuro de Black Mirror”; “Videodrome: entre McLujan y lo reprimido”; “Neuromancer y el origen del cyperpunk”; “Crímenes del futuro y el cine de Cronemberg”; “Las mazmorras artificiales de AI Dungeon”; “La fascinante IA en Dicey Dungeons

 

***

 

 Podés seguir las novedades en mi fan-page: http://www.facebook.com/sivoriluciano. También estoy en Instagram como @viajarleyendo451. Si te gustó la nota, podés invitarme un cafecito.

 

2 comentarios: