Se você tem um arquivo de áudio e precisa transformar em texto, saiba que é possível fazer isso gratuitamente usando inteligência artificial. Neste guia, você vai aprender passo a passo como transcrever arquivos MP3 (ou outros formatos convertidos para MP3) diretamente no computador, utilizando o Whisper, ferramenta de IA desenvolvida pela mesma empresa criadora do ChatGPT.
O que é o Whisper?
O Whisper é um sistema de reconhecimento de voz baseado em inteligência artificial. Ele analisa o áudio, entende o que está sendo dito e converte automaticamente para texto.
A grande vantagem é que ele oferece alta precisão, inclusive para português, e pode ser utilizado gratuitamente através do Google Colab.
O que você precisa antes de começar
Antes de iniciar o processo, você vai precisar de:
-
Uma conta no Google (Gmail)
-
Um arquivo de áudio em formato MP3
-
Acesso ao Google Drive
Caso seu áudio esteja em outro formato, recomenda-se convertê-lo para MP3 antes de iniciar. Isso evita erros e facilita o processamento.
Como instalar o Google Colab no Google Drive
O Whisper será executado dentro do Google Colab, que é uma ferramenta gratuita do Google para rodar códigos online.
Passo a passo:
-
Acesse o Google Drive
-
Clique em Novo
-
Vá em Mais → Conectar mais apps
-
Pesquise por Colaboratory
-
Clique em Instalar
-
Confirme a instalação
Após instalado, ele ficará disponível na opção:
Novo → Mais → Google Colaboratory
Configurando o ambiente corretamente
Depois de abrir o Google Colab, é importante ajustar o ambiente para garantir melhor desempenho.
Alterando para GPU:
-
Clique em Ambiente de execução
-
Selecione Alterar tipo de ambiente de execução
-
Em “Acelerador de hardware”, escolha GPU T4
-
Clique em Salvar
Isso torna o processamento mais rápido, especialmente para áudios maiores.
Inserindo os códigos no Colab
Para que o Whisper funcione, é necessário inserir alguns códigos no ambiente.
Como adicionar uma célula de código:
Se a área de código não aparecer automaticamente:
-
Passe o mouse na linha central da tela
-
Clique em + Código
Depois:
-
Cole o primeiro código
-
Clique no botão ▶️ (Play)
-
Aguarde a instalação finalizar
Repita o processo com o segundo código.
É importante aguardar cada etapa concluir antes de continuar.
Enviando o arquivo de áudio
Depois da instalação, é hora de subir o áudio.
Como fazer upload:
-
Clique no ícone de pasta no menu lateral
-
Arraste o arquivo MP3 para a área indicada
ou -
Clique no botão Upload e selecione o arquivo
Dica importante sobre o nome do arquivo
Para evitar erros:
-
Use nomes simples
-
Evite acentos
-
Evite espaços
-
Use letras minúsculas
Exemplos recomendados:
-
audio1.mp3
-
entrevista2.mp3
-
aula3.mp3
Arquivos muito grandes (acima de 30 minutos) podem ser divididos em partes para facilitar o processamento.
Executando a transcrição
Após subir o arquivo:
-
Cole o código final responsável pela transcrição
-
Certifique-se de que o nome do arquivo está correto no código
-
Clique em ▶️ (Play)
-
Aguarde o processamento
O tempo varia conforme o tamanho do áudio.
Baixando o arquivo transcrito
Quando o processo termina, o Colab gera vários arquivos:
-
JSON
-
SRT (legendas)
-
TSV
-
TXT
Para obter o texto simples:
-
Vá até o arquivo .txt
-
Clique nos três pontos
-
Selecione Download
O arquivo TXT será baixado com a transcrição pronta para uso.
Dicas para melhores resultados
-
Utilize áudio com boa qualidade
-
Evite muito ruído de fundo
-
Divida arquivos muito longos
-
Use nomes simples nos arquivos
-
Sempre selecione GPU antes de iniciar
Seguindo esses cuidados, a taxa de erro na transcrição tende a ser baixa.
Vale a pena usar essa ferramenta?
Para quem precisa transcrever aulas, reuniões, entrevistas, podcasts ou criar conteúdo em texto a partir de áudio, essa solução é prática, gratuita e eficiente.
Não exige instalação no computador e roda totalmente online pelo navegador.
Transcrever áudio para texto deixou de ser um processo complicado. Com o Whisper e o Google Colab, é possível fazer isso de forma gratuita e relativamente rápida, mesmo sem conhecimento técnico avançado. Basta seguir o passo a passo corretamente e aguardar o processamento.
Quer ver esse conteúdo em vídeo?
Assista no canal Nerd em Evolução.
📌 Prompt para usar Whisper no Google Colab
1️⃣ Instalação (rode primeiro):
!pip install git+https://github.com/openai/whisper.git
!sudo apt update && sudo apt install ffmpeg
2️⃣ Transcrição do áudio:
!whisper “nome-do-arquivo.mp3” –model medium
🔹 Troque “nome-do-arquivo.mp3” pelo nome do seu áudio