GitHub - edelmarsilva/pml-audio-para-texto: Transcreva seus áudios em arquivos de texto do word

Áudio para texto

Este simples trecho de código percorre todos os arquivos de áudio de uma pasta chamada audios para fazer a transcrição para texto, gerando para cada arquivo, um novo arquivo com o mesmo nome no formato .docx

O PML (modelo de linguagem pré-treinado) whisper-large-v3 foi criado e é mantido pela OpenAI.

Whisper

Whisper é um modelo pré-treinado para reconhecimento automático de fala (ASR) e tradução de fala. Treinado com 680 mil horas de dados rotulados, os modelos Whisper demonstram uma forte capacidade de se adaptar a muitos conjuntos de dados e áreas sem a necessidade de ajustes finos.

Saiba mais em https://huggingface.co/openai/whisper-large-v3

Requisitos

Cria uma pasta chamada audios (para os arquivos de áudio) e outra audios-transcritos (resultado da transcrição)

mkdir audios
mkdir audios-transcritos

Instale o FFMPEG

sudo apt install ffmpeg

Use o pip para instalar o conteúdo do requirements.txt

pip install -r requirements.txt

Uso

Após copiar os áudios a serem transcritos para a pasta audios, execute o arquivo transcrever-audios.py

py transcrever-audios.py

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
.github/ISSUE_TEMPLATE		.github/ISSUE_TEMPLATE
.idea		.idea
static		static
templates		templates
.gitignore		.gitignore
README.md		README.md
app.py		app.py
requirements.txt		requirements.txt
transcrever-audios.py		transcrever-audios.py
transcribe.py		transcribe.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Áudio para texto

Whisper

Requisitos

Uso

About

Releases

Packages

Contributors 2

Languages

edelmarsilva/pml-audio-para-texto

Folders and files

Latest commit

History

Repository files navigation

Áudio para texto

Whisper

Requisitos

Uso

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages