To Do list
-
hacer evaluaci贸n preliminar
-
pensar en el pipeline de whisper (ID de cada archivo, estructura del proceso, estructura de carpetas, etc.)
-
Bash pipeline for running whisper on several audio splits for several audio files
-
Python script to split songs from large audio file (sacar canciones de la grabaci贸n de una cara entera de un vinilo)
-
Script para juntar transcripciones de audio_splits en un solo archibo para generar transcripci贸n de un audio_file
-
pipeline para descargar videos de youtube y anotarlos (m谩s r谩pido que grabar vinilos)
-
pipeline para hacer crear un dataset en hugging faces y hacer una pr谩ctica del fine tunning para asegurarme de que estoy haciendo correctamente el dataset.
-
Youtube-dl: usfeul tool for audio extraction from youtube videos from command line. Installed using
conda install -c conda-forge youtube-dl
-
Varios cron贸metros a la vez para medir manualmente tiempo de cante vs tiempo de quej铆os