Hoje, temos o prazer de apresentar um modo de lote na API Gemini, um novo endpoint assíncrono projetado especificamente para cargas de trabalho de alta capacidade de processamento e não críticas em relação à latência. O modo de lote da API Gemini permite que você envie jobs grandes, elimine a sobrecarga do agendamento e do processamento e recupere os resultados em até 24 horas, tudo com um desconto de 50% em comparação com nossas APIs síncronas.
O modo de lote é a ferramenta perfeita para qualquer tarefa na qual você tenha os dados prontos e não precise de uma resposta imediata. Ao separar esses jobs grandes do tráfego em tempo real, você desbloqueia três benefícios principais:
Projetamos a API para que ela fosse simples e intuitiva. Você empacota todas as suas solicitações em um único arquivo, envia o arquivo e recupera os resultados assim que o job é concluído. Veja a seguir algumas maneiras pelas quais os desenvolvedores já estão utilizando o modo de lote para as tarefas:
Você pode começar a usar o modo de lote hoje mesmo com o SDK Python para Google GenAI:
# Create a JSONL that contains these lines:
# {"key": "request_1", "request": {"contents": [{"parts": [{"text": "Explain how AI works in a few words"}]}]}},
# {"key": "request_2", "request": {"contents": [{"parts": [{"text": "Explain how quantum computing works in a few words"}]}]}}
uploaded_batch_requests = client.files.upload(file="batch_requests.json")
batch_job = client.batches.create(
model="gemini-2.5-flash",
src=uploaded_batch_requests.name,
config={
'display_name': "batch_job-1",
},
)
print(f"Created batch job: {batch_job.name}")
# Wait for up to 24 hours
if batch_job.state.name == 'JOB_STATE_SUCCEEDED':
result_file_name = batch_job.dest.file_name
file_content_bytes = client.files.download(file=result_file_name)
file_content = file_content_bytes.decode('utf-8')
for line in file_content.splitlines():
print(line)
Para saber mais, confira a documentação oficial e as páginas de preços.
Estamos lançando o modo de lote para a API Gemini hoje e amanhã para todos os usuários. Esse é apenas o começo do processamento em lote, e estamos trabalhando ativamente para expandir os recursos. Em breve, teremos opções mais poderosas e flexíveis!
Simplify your Agent "vibe building" flow with ADK and Gemini CLI
Build with Veo 3, now available in the Gemini API
Unlock Gemini’s reasoning: A step-by-step guide to logprobs on Vertex AI