Question 1

¿Qué duración puede tener un archivo de audio?

WikiPlus · Accepted Answer

Prácticamente ilimitada. Whisper procesa audio en bloques de 30 segundos, por lo que podcasts de 2 horas o entrevistas de 3 horas funcionan bien — espera procesado aproximadamente en tiempo real (un archivo de 60 minutos tarda unos 60 minutos en un portátil de gama media). Archivos más largos usan más memoria.

Question 2

¿Whisper transcribe música y canto?

WikiPlus · Accepted Answer

Parcialmente. Whisper apunta al habla, así que la música instrumental produce salidas vacías o confusas. Las letras en voz cantada con claridad pueden transcribirse, pero la calidad varía — para extracción de letras, las herramientas dedicadas funcionan mejor.

Question 3

¿El transcriptor traduce entre idiomas?

WikiPlus · Accepted Answer

Sí. Whisper tiene un modo de traducción integrado que produce inglés independientemente del idioma de origen. El transcriptor lo expone como un interruptor — útil para hacer que podcasts, reuniones o entrevistas en otro idioma sean buscables en inglés.

Audio

Transcriptor de Audio

Recortador de Audio

Preguntas frecuentes