Pular para o conteúdo principal

🖼️ Como Transcrever Imagens?


1. O que é essa novidade?

Agora a Stevo consegue ler e resumir automaticamente imagens e PDFs que você envia pelo sistema.

TipoO que a IA faz
ImagensDescreve o que aparece na foto (objetos, pessoas, contexto etc.)
PDFsGera um resumo do conteúdo (tipo: "comprovante de pagamento, valor X, data Y, banco Z…")

Isso ajuda:

  • ✅ Operação que recebe muito documento/nota/comprovante
  • ✅ Bots e atendentes entenderem o que o cliente mandou sem precisar abrir o arquivo
  • ✅ Fluxos de IA (como assistentes e bots) a "enxergarem" a imagem/PDF via resumo

2. Pré-requisitos

Antes de ativar:

  1. ✅ Ter uma chave de API do ChatGPT (OpenAI) válida
  2. Salvar essa chave dentro da Stevo, na área de configurações de IA / ChatGPT
  3. ✅ (Opcional / futuro) Ter chave de outros provedores, como Groq, quando estiver disponível
Importante

No momento, o recurso está funcionando com o ChatGPT. Groq e outros provedores serão adicionados depois.


3. Como ativar o resumo de imagens e PDFs na Stevo

3.1. Acessando as configurações

  1. ✅ No painel da Stevo, clique em Configurações
  2. ✅ Entre na aba/área de Configurações Gerais / CRM (ou equivalente no seu painel)

3.2. Ativando os recursos

Dentro de Configurações, você vai ver duas novas opções:

  • Resumir imagens
  • Resumir PDFs

Passo a passo:

  1. Localize os botões de ativação: "Resumir imagens" e "Resumir PDFs"
  2. Marque/ative: Você pode ativar só imagens, só PDFs ou as duas opções juntas
  3. Escolha qual IA vai fazer o resumo (no momento: ChatGPT, futuro: Groq)
  4. ✅ Confirme se a chave do ChatGPT está preenchida e salva nas configurações

4. Como funciona na prática

Depois de ativar:

4.1. Envio de imagem

  1. O usuário envia uma imagem na conversa
  2. O sistema manda essa imagem para a IA
  3. A IA devolve um texto descrevendo a imagem, que aparece na tela
💡 Exemplo

Uma foto de uma refeição na mesa → A IA descreve: "pão mordido, mão segurando, ketchup, canudo, etc." - uma descrição bem detalhada do que tem na imagem.

Por que é útil:

  • O atendente consegue entender rapidamente o que o cliente mandou
  • Uma IA/bot que lê só texto passa a "entender" a imagem através da descrição

4.2. Envio de PDF

  1. O usuário envia um PDF (por exemplo, um comprovante de pagamento)
  2. O sistema envia o PDF para a IA
  3. A IA retorna um resumo do conteúdo do PDF
💡 Exemplo

Um comprovante de pagamento via internet → O resumo traz: tipo de documento, forma de pagamento, valor, data, banco, etc.

Mesmo que o PDF seja baixado e aberto em outra aba, o resumo já vai estar na conversa, facilitando a vida do operador.


5. Tempo de resposta (latência)

Quando você ativa essa função, lembre-se:

TipoTempo médio
Imagens8–15 segundos
PDFs15–20 segundos (dependendo do tamanho)
⚠️ Atenção

O resumo não é instantâneo. É normal ter esse pequeno atraso porque:

  • A imagem/PDF é enviada para a IA
  • A IA lê, interpreta e responde com o resumo
  • O sistema então exibe isso na tela

6. Ativando também na Evolution

O mesmo recurso de resumo está disponível também na Evolution.

6.1. Ativando na Evolution

  1. ✅ Acesse o painel da Evolution
  2. ✅ Vá na área de Configurações / IA / Resumo
  3. ✅ Ative as opções de: Resumir imagens e Resumir PDFs
  4. ✅ Configure também qual IA será usada (ChatGPT, e futuramente Groq)
  5. ✅ Garanta que a chave de API esteja salva lá também

6.2. Gerenciar número e travar envios

No Gerenciar Número dentro da Evolution, existe a opção de:

  • Definir qual conta pode enviar mensagem naquela linha específica
  • ✅ "Travar" para que somente aquele usuário/operação envie mensagens por aquela conta

Isso já está:

  • Disponível na Evolution
  • Pode ser usado junto com o recurso de resumo, para dar mais controle sobre quem usa aquele número na operação