Saltar para o conteúdo principal

Visão Geral

Este endpoint faz parte da API de Lote compatível com OpenAI da TokenLab. Trabalhos em lote utilizam arquivos JSONL carregados, são executados de forma assíncrona e podem retornar arquivos de saída/erro posteriormente.

Observações

  • Arquivos de entrada em lote devem usar purpose=batch.
  • completion_window é atualmente 24h.
  • A ordenação da saída não é garantida; sempre combine pelo custom_id.
  • Streaming não é suportado dentro dos itens de lote.

Exemplo

curl -X POST "https://api.tokenlab.sh/v1/batches" \
  -H "Authorization: Bearer sk-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "input_file_id": "file_abc123",
    "endpoint": "/v1/chat/completions",
    "completion_window": "24h"
  }'

Solicitação / Resposta

Use o painel interativo do OpenAPI acima para o esquema exato.

Dicas Operacionais

  • Use custom_id para reconciliação idempotente a montante.
  • Espere output_file_id e error_file_id apenas após o trabalhador finalizar o lote.
  • A precificação de lote pode diferir da precificação síncrona porque as regras de desconto isBatchRequest=true se aplicam.