Resumen
La generación de video es asíncrona. Envías una solicitud, recibes unatask_id y un poll_url, y luego consultas periódicamente hasta obtener el resultado final.
Para el comportamiento de polling más fiable, usa exactamente el
poll_url que devuelve la respuesta de creación.Si una respuesta de creación devuelve
poll_url, llama exactamente a esa URL. Cuando apunte a /v1/tasks/{id}, trátala como el endpoint fijo canónico de estado.Para integraciones en producción, es mejor usar URLs
https públicas para imágenes, videos y audio. Los modelos compatibles siguen aceptando URLs data:, pero los payloads base64 grandes son más difíciles de reintentar, inspeccionar y depurar.Cuerpo de la solicitud
ID del modelo de video. El valor predeterminado de la API es
sora-2. Consulta la guía de generación de video para ver la matriz pública actual y las capacidades compatibles.Descripción en texto del video que quieres generar. Este campo es obligatorio para la mayoría de los modelos públicos de video.
Operación de video que se va a ejecutar. El contrato público admite
text-to-video, image-to-video, reference-to-video, start-end-to-video, video-to-video, video-extension, audio-to-video y motion-control. LemonData puede inferir la operación a partir de las entradas, pero en producción se recomienda enviarla de forma explícita.URL pública de la imagen inicial para flujos image-to-video. Para la compatibilidad más amplia entre modelos, conviene preferir
image_url.Imagen inline como URL
data: (por ejemplo, data:image/jpeg;base64,...). Los modelos compatibles la aceptan, pero image_url suele ser más robusta en producción.Imágenes de referencia para flujos reference-to-video. Puedes enviar hasta 3 elementos. Se recomiendan URLs
https públicas, aunque los modelos compatibles también aceptan URLs data:.Campo opcional para modelos que distinguen entre referencias
asset y style.URL pública del video de origen. Es obligatoria para los flujos públicos actuales de
video-to-video y para los modelos de motion-control.URL pública del audio para modelos que admiten
audio-to-video.Identificador de tarea del proveedor para algunos flujos de continuación, extensión o derivación.
Desplazamiento inicial específico del modelo para algunos flujos
video-extension.Multiplicador o número de repeticiones específico del modelo para algunos flujos
video-extension.Duración del video en segundos. Los valores admitidos dependen del modelo.
Relación de aspecto, por ejemplo
16:9, 9:16 o 1:1.Resolución de salida, por ejemplo
720p, 1080p o 4k. La compatibilidad depende del modelo.Interruptor de salida de audio dependiente del modelo. En LemonData, la familia Veo 3 usa
true por defecto cuando este campo se omite. El alias camelCase outputAudio también se acepta por compatibilidad.Fotogramas por segundo (1-120). Solo surte efecto en los modelos que exponen FPS.
Elementos que deben evitarse en el video generado.
Semilla aleatoria para resultados reproducibles.
Intensidad de adherencia al prompt (0-20) en los modelos que exponen este control.
Intensidad del movimiento (0-1) en los modelos que exponen este control.
URL de la imagen del primer fotograma, o entrada compatible, para
start-end-to-video.URL de la imagen del último fotograma, o entrada compatible, para
start-end-to-video.Nivel de tamaño específico del modelo para algunos modelos de video compatibles con OpenAI.
Interruptor de marca de agua para los modelos que lo exponen públicamente.
Selector de efecto específico del modelo para algunos flujos especializados de edición o efectos.
Identificador único del usuario final.
Notas de compatibilidad
- Los campos públicos canónicos están en snake_case:
reference_images,reference_image_typeyoutput_audio. - Por compatibilidad, LemonData también acepta los alias camelCase
referenceImages,referenceImageTypeyoutputAudio. - Si omites
operation, LemonData la infiere a partir de las entradas. Aun así, en producción se recomienda enviarla explícitamente.
Buenas prácticas para entradas de medios
- Para
image_url,reference_images,video_urlyaudio_url, es preferible usar URLshttpspúblicas. - Siempre que sea posible, evita mezclar base64 inline y URLs remotas en la misma solicitud.
- Si usas URLs firmadas, asegúrate de que sigan siendo válidas durante todo el tiempo necesario para reintentos y creación asíncrona de tareas.
Respuesta
Identificador canónico de la tarea asíncrona. Cuando
id y task_id estén presentes a la vez, considéralos la misma tarea.Identificador único de la tarea para hacer polling.
URL de polling recomendada para esta tarea. Usa exactamente esta ruta al consultar el estado.
Estado inicial:
pending.Marca de tiempo Unix de creación de la tarea.
Modelo utilizado.
Imagen a video
Referencia a video
Cuando el modelo admite condicionamiento con imágenes de referencia, usaoperation=reference-to-video. En el contrato público de LemonData, las referencias se envían mediante reference_images.
Control de fotograma inicial y final
Usastart_image y end_image para controlar el primer y el último fotograma.
Video a video
Cuando un modelo acepta un video existente como entrada principal, usaoperation=video-to-video.
Control de movimiento
Cuando un modelo necesita tanto una imagen del sujeto como un video de referencia de movimiento, usaoperation=motion-control. LemonData normaliza la forma pública image_url + video_url al contrato upstream correspondiente.
Disponibilidad actual de audio-to-video y video-extension
El contrato público de LemonData aceptaaudio-to-video y video-extension para flujos específicos de ciertos modelos. Sin embargo, en la lista pública de modelos generalmente habilitados de esta compilación de documentación no hay ningún modelo ampliamente habilitado que anuncie públicamente estas capacidades. Antes de integrar esos flujos, confirma la disponibilidad actual mediante la Models API o la página de modelos.
Inventario público actual de modelos
Esta lista está alineada con el inventario público de modelos de video habilitados en esta compilación de documentación. Para el estado más reciente, consulta la Models API.
OpenAI
| Modelo | Operaciones públicas |
|---|---|
sora-2 | Texto a video, imagen a video |
sora-2-pro | Texto a video, imagen a video |
sora-2-pro-storyboard | Imagen a video |
Kuaishou
| Modelo | Operaciones públicas |
|---|---|
kling-3.0-motion-control | Control de movimiento |
kling-3.0-video | Texto a video, imagen a video, inicio-fin a video |
kling-v2.5-turbo-pro | Texto a video, imagen a video, inicio-fin a video |
kling-v2.5-turbo-std | Texto a video, imagen a video |
kling-v2.6-pro | Texto a video, imagen a video, inicio-fin a video |
kling-v2.6-std | Texto a video, imagen a video |
kling-v3.0-pro | Texto a video, imagen a video, inicio-fin a video |
kling-v3.0-std | Texto a video, imagen a video, inicio-fin a video |
kling-video-o1-pro | Texto a video, imagen a video, referencia a video, inicio-fin a video, video a video |
kling-video-o1-std | Texto a video, imagen a video, referencia a video, inicio-fin a video, video a video |
| Modelo | Operaciones públicas |
|---|---|
veo3 | Texto a video, imagen a video |
veo3-fast | Texto a video, imagen a video |
veo3-pro | Texto a video, imagen a video |
veo3.1 | Texto a video, imagen a video, referencia a video, inicio-fin a video |
veo3.1-fast | Texto a video, imagen a video, referencia a video, inicio-fin a video |
veo3.1-pro | Texto a video, imagen a video, inicio-fin a video |
ByteDance
| Modelo | Operaciones públicas |
|---|---|
seedance-1.5-pro | Texto a video, imagen a video |
MiniMax
| Modelo | Operaciones públicas |
|---|---|
hailuo-2.3-fast | Imagen a video |
hailuo-2.3-pro | Texto a video, imagen a video |
hailuo-2.3-standard | Texto a video, imagen a video |
Alibaba
| Modelo | Operaciones públicas |
|---|---|
wan-2.2-plus | Texto a video, imagen a video |
wan-2.5 | Texto a video, imagen a video |
wan-2.6 | Texto a video, imagen a video, referencia a video |
Shengshu
| Modelo | Operaciones públicas |
|---|---|
viduq2 | Texto a video, referencia a video |
viduq2-pro | Imagen a video, referencia a video, inicio-fin a video |
viduq2-pro-fast | Imagen a video, inicio-fin a video |
viduq2-turbo | Imagen a video, inicio-fin a video |
viduq3-pro | Texto a video, imagen a video, inicio-fin a video |
viduq3-turbo | Texto a video, imagen a video, inicio-fin a video |
xAI
| Modelo | Operaciones públicas |
|---|---|
grok-imagine-image-to-video | Imagen a video |
grok-imagine-text-to-video | Texto a video |
grok-imagine-upscale | Video a video |
Otros
| Modelo | Operaciones públicas |
|---|---|
topaz-video-upscale | Video a video |