Fluxograma n8n - Transcrição de Áudio WhatsApp

🎯 Objetivo Principal

Este workflow n8n automatiza a transcrição de mensagens de áudio do WhatsApp, aplicando diferentes tratamentos baseados no tipo de mensagem, duração do áudio e contexto (privado ou grupos).

🔄 Fluxo Principal

Entrada via Webhook: Recebe eventos de mensagens de áudio do WhatsApp
Filtro de Tipo: Verifica se a mensagem é um áudio
Separação de Contexto: Diferencia chats privados de grupos
Controle de Permissões: Verifica se o grupo está autorizado
Extração de Dados: Coleta informações do usuário e mensagem
Processamento de Áudio: Converte e envia para transcrição
Análise de Duração: Direciona para tratamento adequado
IA de Processamento: Aplica algoritmos específicos (Pangeia ou Ultron)
Formatação Final: Estrutura a resposta final
Envio: Retorna a transcrição formatada

🧠 Tratamentos Diferenciados

🎵 Áudios Curtos (≤40s)

IA: Pangeia (Assessora Pessoal)

Resumos inteligentes e acionáveis
Formato minimalista para áudios simples
Classificação automática: simples vs substantivo
Preview rápido + "#mais" para conteúdo completo

🎙️ Áudios Longos (>40s)

IA: Ultron + Framework OGRT

Otimização do Texto
Criação de Frase Gancho
Resumo estruturado (max 300 chars)
Transcrição Revisada e formatada
Substituições padronizadas

🔐 Controles de Segurança

Filtro "Enviado por Mim": Evita processamento de próprios áudios
Permissões de Grupos: Lista de grupos autorizados
Validação de Áudio: Verificação de base64 antes do envio
Timeout Configurado: 180s para transcrição (Groq)

🔧 Tecnologias Integradas

WhatsApp API: Evolution API para mensageria

Groq: Transcrição com Whisper Large v3

Gemini: Processamento de linguagem natural

n8n: Orquestração do workflow

🤖 Fluxograma n8n - Sistema de Transcrição de Áudio WhatsApp