🤖 Fluxograma n8n - Sistema de Transcrição de Áudio WhatsApp

Workflow automatizado para transcrição e análise de mensagens de áudio

Entrada/Webhook
Decisão/Condição
Processamento
IA/Transcrição
Saída/Resposta
Anotações

📋 Explicação do Fluxo

🎯 Objetivo Principal

Este workflow n8n automatiza a transcrição de mensagens de áudio do WhatsApp, aplicando diferentes tratamentos baseados no tipo de mensagem, duração do áudio e contexto (privado ou grupos).

🔄 Fluxo Principal

  1. Entrada via Webhook: Recebe eventos de mensagens de áudio do WhatsApp
  2. Filtro de Tipo: Verifica se a mensagem é um áudio
  3. Separação de Contexto: Diferencia chats privados de grupos
  4. Controle de Permissões: Verifica se o grupo está autorizado
  5. Extração de Dados: Coleta informações do usuário e mensagem
  6. Processamento de Áudio: Converte e envia para transcrição
  7. Análise de Duração: Direciona para tratamento adequado
  8. IA de Processamento: Aplica algoritmos específicos (Pangeia ou Ultron)
  9. Formatação Final: Estrutura a resposta final
  10. Envio: Retorna a transcrição formatada

🧠 Tratamentos Diferenciados

🎵 Áudios Curtos (≤40s)

IA: Pangeia (Assessora Pessoal)

  • Resumos inteligentes e acionáveis
  • Formato minimalista para áudios simples
  • Classificação automática: simples vs substantivo
  • Preview rápido + "#mais" para conteúdo completo

🎙️ Áudios Longos (>40s)

IA: Ultron + Framework OGRT

  • Otimização do Texto
  • Criação de Frase Gancho
  • Resumo estruturado (max 300 chars)
  • Transcrição Revisada e formatada
  • Substituições padronizadas

🔐 Controles de Segurança

  • Filtro "Enviado por Mim": Evita processamento de próprios áudios
  • Permissões de Grupos: Lista de grupos autorizados
  • Validação de Áudio: Verificação de base64 antes do envio
  • Timeout Configurado: 180s para transcrição (Groq)

🔧 Tecnologias Integradas

WhatsApp API: Evolution API para mensageria
Groq: Transcrição com Whisper Large v3
Gemini: Processamento de linguagem natural
n8n: Orquestração do workflow