🖼️ Como Transcrever Imagens?
1. O que é essa novidade?
Agora a Stevo consegue ler e resumir automaticamente imagens e PDFs que você envia pelo sistema.
| Tipo | O que a IA faz |
|---|---|
| Imagens | Descreve o que aparece na foto (objetos, pessoas, contexto etc.) |
| PDFs | Gera um resumo do conteúdo (tipo: "comprovante de pagamento, valor X, data Y, banco Z…") |
Isso ajuda:
- ✅ Operação que recebe muito documento/nota/comprovante
- ✅ Bots e atendentes entenderem o que o cliente mandou sem precisar abrir o arquivo
- ✅ Fluxos de IA (como assistentes e bots) a "enxergarem" a imagem/PDF via resumo
2. Pré-requisitos
Antes de ativar:
- ✅ Ter uma chave de API do ChatGPT (OpenAI) válida
- ✅ Salvar essa chave dentro da Stevo, na área de configurações de IA / ChatGPT
- ✅ (Opcional / futuro) Ter chave de outros provedores, como Groq, quando estiver disponível
No momento, o recurso está funcionando com o ChatGPT. Groq e outros provedores serão adicionados depois.
3. Como ativar o resumo de imagens e PDFs na Stevo
3.1. Acessando as configurações
- ✅ No painel da Stevo, clique em Configurações
- ✅ Entre na aba/área de Configurações Gerais / CRM (ou equivalente no seu painel)
3.2. Ativando os recursos
Dentro de Configurações, você vai ver duas novas opções:
- Resumir imagens
- Resumir PDFs
Passo a passo:
- ✅ Localize os botões de ativação: "Resumir imagens" e "Resumir PDFs"
- ✅ Marque/ative: Você pode ativar só imagens, só PDFs ou as duas opções juntas
- ✅ Escolha qual IA vai fazer o resumo (no momento: ChatGPT, futuro: Groq)
- ✅ Confirme se a chave do ChatGPT está preenchida e salva nas configurações
4. Como funciona na prática
Depois de ativar:
4.1. Envio de imagem
- O usuário envia uma imagem na conversa
- O sistema manda essa imagem para a IA
- A IA devolve um texto descrevendo a imagem, que aparece na tela
Uma foto de uma refeição na mesa → A IA descreve: "pão mordido, mão segurando, ketchup, canudo, etc." - uma descrição bem detalhada do que tem na imagem.
Por que é útil:
- O atendente consegue entender rapidamente o que o cliente mandou
- Uma IA/bot que lê só texto passa a "entender" a imagem através da descrição
4.2. Envio de PDF
- O usuário envia um PDF (por exemplo, um comprovante de pagamento)
- O sistema envia o PDF para a IA
- A IA retorna um resumo do conteúdo do PDF
Um comprovante de pagamento via internet → O resumo traz: tipo de documento, forma de pagamento, valor, data, banco, etc.
Mesmo que o PDF seja baixado e aberto em outra aba, o resumo já vai estar na conversa, facilitando a vida do operador.
5. Tempo de resposta (latência)
Quando você ativa essa função, lembre-se:
| Tipo | Tempo médio |
|---|---|
| Imagens | 8–15 segundos |
| PDFs | 15–20 segundos (dependendo do tamanho) |
O resumo não é instantâneo. É normal ter esse pequeno atraso porque:
- A imagem/PDF é enviada para a IA
- A IA lê, interpreta e responde com o resumo
- O sistema então exibe isso na tela
6. Ativando também na Evolution
O mesmo recurso de resumo está disponível também na Evolution.
6.1. Ativando na Evolution
- ✅ Acesse o painel da Evolution
- ✅ Vá na área de Configurações / IA / Resumo
- ✅ Ative as opções de: Resumir imagens e Resumir PDFs
- ✅ Configure também qual IA será usada (ChatGPT, e futuramente Groq)
- ✅ Garanta que a chave de API esteja salva lá também
6.2. Gerenciar número e travar envios
No Gerenciar Número dentro da Evolution, existe a opção de:
- ✅ Definir qual conta pode enviar mensagem naquela linha específica
- ✅ "Travar" para que somente aquele usuário/operação envie mensagens por aquela conta
Isso já está:
- Disponível na Evolution
- Pode ser usado junto com o recurso de resumo, para dar mais controle sobre quem usa aquele número na operação