Agencias/Ciudad de México.- Meta ha lanzado una herramienta de código abierto que utiliza sus modelos de lenguaje grande (LLM, por sus siglas inglés) Llama para transformar anotaciones en un audio tipo de pódcast al estilo de NotebookLM de Google.
NotebookLlama es “una versión de código abierto de NotebookLM”, como describen directamente los ingenieros de Meta, que han compartido este modelo de lenguaje en GitHub, donde detallan su funcionamiento.
https://twitter.com/Sumanth_077/status/1851985604600566114
Esta herramienta parte de un documento escrito en pdf que procesa para analizar, limpiar y resumir con la ayuda de Llama 3.2 (1B-Instruct), y posteriormente lo transcribe con el apoyo de Llama 3.1 (70B-Instruct), un LLM que “proporcionó transcripciones de pódcast un poco más creativas” para los ejemplos probados por Meta.
También se puede utilizar el modelo Llama 3.1 (8B-Instruct) para hacer que esa transcripción sea “más dramática”. Finalmente, se utiliza tecnología de texto a voz para “generar un pódcast conversacional” a partir de la transcripción.
Esta herramienta recuerda a la función ‘Audio Overviews’ de NotebookLM, que genera un programa de audio o pódcast a partir de las notas guardadas por el usuario. En el caso de la herramienta de Meta, la compañía matiza que las voces todavía no suenan muy naturales y los agentes de voz tampoco respetan el turno de palabra, dificultando el formato debate.
https://twitter.com/reach_vb/status/1850522281681813862