Pular para o conteúdo principal

🖼️ ¿Cómo Transcribir Imágenes?


1. ¿Qué es esta novedad?

Ahora Stevo puede leer y resumir automáticamente imágenes y PDFs enviados por el sistema.

TipoLo que hace la IA
ImágenesDescribe lo que aparece en la foto (objetos, personas, contexto, etc.)
PDFsGenera un resumen del contenido (ej.: “comprobante de pago, monto X, fecha Y, banco Z…”)

Esto ayuda a:

  • ✅ Operaciones que reciben muchos documentos/comprobantes
  • ✅ Bots y agentes a entender lo que el cliente envió sin abrir el archivo
  • ✅ Flujos de IA (asistentes, bots) a “ver” la imagen/PDF mediante el resumen

2. Requisitos Previos

Antes de activar:

  1. ✅ Tener una clave API de ChatGPT (OpenAI) válida
  2. Guardar esta clave dentro de Stevo, en la sección de IA / ChatGPT
  3. ✅ (Opcional / futuro) Tener clave de proveedores como Groq cuando esté disponible
Importante

Por ahora, el recurso funciona únicamente con ChatGPT. Groq y otros serán añadidos más adelante.


3. Cómo Activar el Resumen de Imágenes y PDFs en Stevo

3.1. Acceso a Configuraciones

  1. ✅ En el panel de Stevo, haz clic en Configuraciones
  2. ✅ Entra a Configuraciones Generales / CRM

3.2. Activar los Recursos

Dentro de configuraciones verás dos nuevas opciones:

  • Resumir imágenes
  • Resumir PDFs

Pasos:

  1. ✅ Localiza los botones: “Resumir Imágenes” y “Resumir PDFs”
  2. ✅ Activa uno o ambos
  3. ✅ Selecciona la IA que hará el resumen (actualmente: ChatGPT)
  4. ✅ Confirma que la clave API está guardada

4. Cómo Funciona en la Práctica

4.1. Envío de Imagen

  1. El usuario envía una imagen
  2. El sistema la envía a la IA
  3. La IA devuelve una descripción detallada
💡 Ejemplo

Una foto de una comida → La IA describe: “pan mordido, mano sujetando, ketchup, popote, etc.”

Por qué es útil:

  • El agente entiende al instante lo que el cliente envió
  • Un bot que solo lee texto ahora “entiende” la imagen mediante la descripción

4.2. Envío de PDF

  1. El usuario envía un PDF
  2. El sistema lo envía a la IA
  3. La IA devuelve un resumen del contenido
💡 Ejemplo

Comprobante de pago digital → El resumen trae tipo de documento, monto, fecha, banco, etc.

Aunque abras el PDF por separado, el resumen aparece automáticamente en la conversación.


5. Tiempo de Respuesta (Latencia)

TipoTiempo promedio
Imágenes8–15 segundos
PDFs15–20 segundos
⚠️ Atención

El resumen no es instantáneo. Este retraso es normal porque:

  • La imagen/PDF se envía a la IA
  • La IA analiza y genera el resumen
  • El sistema lo muestra en pantalla

6. Activando También en Evolution

Este mismo recurso también está disponible en Evolution.

6.1. Cómo Activarlo en Evolution

  1. ✅ Accede al panel de Evolution
  2. ✅ Ve a Configuraciones / IA / Resumen
  3. ✅ Activa: Resumir imágenes y Resumir PDFs
  4. ✅ Selecciona la IA que procesará los resúmenes
  5. ✅ Revisa que la clave API esté guardada allí también

6.2. Gestionar Número y Restringir Envíos

En Gestionar Número dentro de Evolution puedes:

  • ✅ Definir qué usuario puede enviar mensajes desde ese número
  • ✅ Bloquear para que solo ese usuario/operación use la línea

Esto ya está:

  • Disponible en Evolution
  • Diseñado para funcionar junto con el resumen automático