To Do list

  • hacer evaluaci贸n preliminar

  • pensar en el pipeline de whisper (ID de cada archivo, estructura del proceso, estructura de carpetas, etc.)

  • Bash pipeline for running whisper on several audio splits for several audio files

  • Python script to split songs from large audio file (sacar canciones de la grabaci贸n de una cara entera de un vinilo)

  • Script para juntar transcripciones de audio_splits en un solo archibo para generar transcripci贸n de un audio_file

  • pipeline para descargar videos de youtube y anotarlos (m谩s r谩pido que grabar vinilos)

  • pipeline para hacer crear un dataset en hugging faces y hacer una pr谩ctica del fine tunning para asegurarme de que estoy haciendo correctamente el dataset.

  • Youtube-dl: usfeul tool for audio extraction from youtube videos from command line. Installed using conda install -c conda-forge youtube-dl

  • Varios cron贸metros a la vez para medir manualmente tiempo de cante vs tiempo de quej铆os