WikiPlus
Audio · 2 herramientas

Audio

El transcriptor de audio de WikiPlus convierte voz en archivos de audio en texto con marcas de tiempo usando un modelo Whisper integrado en el navegador. Arrastra un MP3, WAV, M4A u OGG a la página, e…

Procesamiento 100% privado

Todas las operaciones ocurren en tu dispositivo usando WebAssembly. Nada se sube — ideal para documentos sensibles.

Filtrar

El transcriptor de audio de WikiPlus convierte voz en archivos de audio en texto con marcas de tiempo usando un modelo Whisper integrado en el navegador. Arrastra un MP3, WAV, M4A u OGG a la página, elige el idioma de origen entre más de 90 opciones y mira cómo se va formando la transcripción párrafo a párrafo a medida que avanza la inferencia. Luego cópiala al portapapeles, expórtala como TXT o SRT y sigue con lo tuyo. El modelo se descarga una vez y se ejecuta íntegramente en local, así que podcasts, grabaciones de reuniones y entrevistas permanecen totalmente privados.

Todas las herramientas de esta página se ejecutan íntegramente dentro de tu navegador. Nada se sube a nuestros servidores, nada queda almacenado en caché para más tarde y no hace falta crear cuenta. Los archivos se procesan en tu propio dispositivo mediante módulos WebAssembly y las bibliotecas de código abierto que impulsan cada utilidad, así que los documentos confidenciales siguen siendo confidenciales — y si pierdes la conexión después de cargar la página, la mayoría de las herramientas seguirán funcionando. Elige abajo la utilidad que necesites y empieza a trabajar al momento.

Preguntas frecuentes

¿Qué duración puede tener un archivo de audio?
Prácticamente ilimitada. Whisper procesa audio en bloques de 30 segundos, por lo que podcasts de 2 horas o entrevistas de 3 horas funcionan bien — espera procesado aproximadamente en tiempo real (un archivo de 60 minutos tarda unos 60 minutos en un portátil de gama media). Archivos más largos usan más memoria.
¿Whisper transcribe música y canto?
Parcialmente. Whisper apunta al habla, así que la música instrumental produce salidas vacías o confusas. Las letras en voz cantada con claridad pueden transcribirse, pero la calidad varía — para extracción de letras, las herramientas dedicadas funcionan mejor.
¿El transcriptor traduce entre idiomas?
Sí. Whisper tiene un modo de traducción integrado que produce inglés independientemente del idioma de origen. El transcriptor lo expone como un interruptor — útil para hacer que podcasts, reuniones o entrevistas en otro idioma sean buscables en inglés.