Saltar al contenido principal

Resumen

Traduce audio en cualquier idioma compatible a texto en inglés. A diferencia de la transcripción, este endpoint siempre devuelve texto en inglés independientemente del idioma de entrada.

Cuerpo de la solicitud

file
file
requerido
El archivo de audio a traducir. Formatos compatibles: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm. El tamaño máximo del archivo es de 25 MB.
model
string
predeterminado:"whisper-1"
El modelo que se utilizará. Actualmente, solo se admite whisper-1.
prompt
string
Un texto opcional para guiar el estilo del modelo o continuar un segmento anterior. Debe estar en inglés.
response_format
string
predeterminado:"json"
El formato de la salida. Opciones: json, text, srt, verbose_json, vtt.
temperature
number
La temperatura de muestreo, entre 0 y 1. Los valores más altos, como 0.8, producen una salida más aleatoria, mientras que los valores más bajos, como 0.2, hacen que la salida sea más enfocada y determinista.

Respuesta

text
string
El texto traducido en inglés.
Para el formato verbose_json, la respuesta también incluye:
language
string
El idioma detectado del audio de entrada.
duration
number
La duración del audio de entrada en segundos.
segments
array
Segmentos del texto traducido con marcas de tiempo.
curl -X POST "https://api.lemondata.cc/v1/audio/translations" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F "file=@german_audio.mp3" \
  -F "model=whisper-1"
{
  "text": "Hello, my name is Wolfgang and I come from Germany. Where are you from?"
}

Traducción vs Transcripción

CaracterísticaTraducciónTranscripción
Idioma de salidaSiempre inglésIgual que la entrada
Caso de usoConvertir audio en otro idioma a inglésPreservar el idioma original
Parámetro de idiomaNo aplicablePista opcional
El endpoint de traducción detecta automáticamente el idioma de origen y traduce al inglés. El parámetro language de la transcripción se ignora.