Cuerpo de la solicitud
Modelo a utilizar (p. ej.,
dall-e-3, flux-pro, midjourney).Descripción de texto de la imagen deseada.
Número de imágenes a generar (1-4, según el modelo).
Tamaño de la imagen. Las opciones varían según el modelo:
- DALL-E 3:
1024x1024,1792x1024,1024x1792 - Otros modelos:
512x512,1024x1024, etc.
Calidad de la imagen (
standard o hd). Solo DALL-E 3.Formato de respuesta:
url o b64_json.Estilo para DALL-E 3:
vivid o natural.Un identificador único para el usuario final.
Respuesta
Respuesta sincrónica (DALL-E, Flux Schnell, etc.)
Marca de tiempo Unix de creación.
Array de imágenes generadas.Cada objeto contiene:
url(string): URL de la imagen generadab64_json(string): Imagen codificada en Base64 (si se solicitó)revised_prompt(string): El prompt utilizado (DALL-E 3)
Respuesta asíncrona (Midjourney, Flux Pro, Ideogram, etc.)
Algunos modelos requieren más tiempo de procesamiento y devuelven una respuesta async:Marca de tiempo Unix de creación.
Identificador único de la tarea para polling.
Estado inicial:
pending.URL relativa para consultar los resultados (p. ej.,
/v1/images/generations/{task_id}).Array con datos de marcador de posición.
url estará vacío hasta que se complete.Cuando recibas
status: "pending", usa el endpoint Get Image Status para consultar el resultado.Modelos disponibles
| Model | Type | Features |
|---|---|---|
dall-e-3 | Sync | Mejor calidad, mejora de prompts |
dall-e-2 | Sync | Más rápido, más económico |
flux-pro | Async | Fotorrealista, alta calidad |
flux-schnell | Sync | Muy rápido |
midjourney | Async | Estilo artístico |
ideogram-v3 | Async | Mejor renderizado de texto |
stable-diffusion-3 | Sync | Código abierto, personalizable |
Manejo de respuestas async
Para modelos async, verifica si la respuesta contienestatus: "pending":