🖼️ ¿Cómo Transcribir Imágenes?
1. ¿Qué es esta novedad?
Ahora Stevo puede leer y resumir automáticamente imágenes y PDFs enviados por el sistema.
| Tipo | Lo que hace la IA |
|---|---|
| Imágenes | Describe lo que aparece en la foto (objetos, personas, contexto, etc.) |
| PDFs | Genera un resumen del contenido (ej.: “comprobante de pago, monto X, fecha Y, banco Z…”) |
Esto ayuda a:
- ✅ Operaciones que reciben muchos documentos/comprobantes
- ✅ Bots y agentes a entender lo que el cliente envió sin abrir el archivo
- ✅ Flujos de IA (asistentes, bots) a “ver” la imagen/PDF mediante el resumen
2. Requisitos Previos
Antes de activar:
- ✅ Tener una clave API de ChatGPT (OpenAI) válida
- ✅ Guardar esta clave dentro de Stevo, en la sección de IA / ChatGPT
- ✅ (Opcional / futuro) Tener clave de proveedores como Groq cuando esté disponible
Importante
Por ahora, el recurso funciona únicamente con ChatGPT. Groq y otros serán añadidos más adelante.
3. Cómo Activar el Resumen de Imágenes y PDFs en Stevo
3.1. Acceso a Configuraciones
- ✅ En el panel de Stevo, haz clic en Configuraciones
- ✅ Entra a Configuraciones Generales / CRM
3.2. Activar los Recursos
Dentro de configuraciones verás dos nuevas opciones:
- Resumir imágenes
- Resumir PDFs
Pasos:
- ✅ Localiza los botones: “Resumir Imágenes” y “Resumir PDFs”
- ✅ Activa uno o ambos
- ✅ Selecciona la IA que hará el resumen (actualmente: ChatGPT)
- ✅ Confirma que la clave API está guardada
4. Cómo Funciona en la Práctica
4.1. Envío de Imagen
- El usuario envía una imagen
- El sistema la envía a la IA
- La IA devuelve una descripción detallada
💡 Ejemplo
Una foto de una comida → La IA describe: “pan mordido, mano sujetando, ketchup, popote, etc.”
Por qué es útil:
- El agente entiende al instante lo que el cliente envió
- Un bot que solo lee texto ahora “entiende” la imagen mediante la descripción
4.2. Envío de PDF
- El usuario envía un PDF
- El sistema lo envía a la IA
- La IA devuelve un resumen del contenido
💡 Ejemplo
Comprobante de pago digital → El resumen trae tipo de documento, monto, fecha, banco, etc.
Aunque abras el PDF por separado, el resumen aparece automáticamente en la conversación.
5. Tiempo de Respuesta (Latencia)
| Tipo | Tiempo promedio |
|---|---|
| Imágenes | 8–15 segundos |
| PDFs | 15–20 segundos |
⚠️ Atención
El resumen no es instantáneo. Este retraso es normal porque:
- La imagen/PDF se envía a la IA
- La IA analiza y genera el resumen
- El sistema lo muestra en pantalla
6. Activando También en Evolution
Este mismo recurso también está disponible en Evolution.
6.1. Cómo Activarlo en Evolution
- ✅ Accede al panel de Evolution
- ✅ Ve a Configuraciones / IA / Resumen
- ✅ Activa: Resumir imágenes y Resumir PDFs
- ✅ Selecciona la IA que procesará los resúmenes
- ✅ Revisa que la clave API esté guardada allí también
6.2. Gestionar Número y Restringir Envíos
En Gestionar Número dentro de Evolution puedes:
- ✅ Definir qué usuario puede enviar mensajes desde ese número
- ✅ Bloquear para que solo ese usuario/operación use la línea
Esto ya está:
- Disponible en Evolution
- Diseñado para funcionar junto con el resumen automático