Nos complace presentar un modo por lotes en la API de Gemini, un nuevo extremo asincrónico diseñado específicamente para cargas de trabajo de alto rendimiento y no críticas para la latencia. El modo por lotes de la API de Gemini te permite enviar trabajos grandes, descargar la programación y el procesamiento, y recuperar sus resultados en 24 horas, todo con un descuento del 50% en comparación con nuestras APIs sincrónicas.
El modo por lotes es la herramienta perfecta para cualquier tarea en la que tengas tus datos listos por adelantado y no necesites una respuesta inmediata. Al separar estos grandes trabajos de tu tráfico en tiempo real, puedes aprovechar tres beneficios clave:
Diseñamos la API para que sea simple e intuitiva. Tú empaquetas todas las solicitudes en un solo archivo, lo envías y obtienes tus resultados una vez que el trabajo está completo. Estas son algunas formas en que los desarrolladores están aprovechando el modo por lotes para las tareas actuales:
Puedes comenzar a usar el modo por lotes hoy mismo con el SDK de Python de Google GenAI:
# Crea un JSONL que contenga estas líneas:
# {"key": "request_1", "request": {"contents": [{"parts": [{"text": "Explain how AI works in a few words"}]}]}},
# {"key": "request_2", "request": {"contents": [{"parts": [{"text": "Explain how quantum computing works in a few words"}]}]}}
uploaded_batch_requests = client.files.upload(file="batch_requests.json")
batch_job = client.batches.create(
model="gemini-2.5-flash",
src=uploaded_batch_requests.name,
config={
'display_name': "batch_job-1",
},
)
print(f"Created batch job: {batch_job.name}")
# Espera 24 horas
if batch_job.state.name == 'JOB_STATE_SUCCEEDED':
result_file_name = batch_job.dest.file_name
file_content_bytes = client.files.download(file=result_file_name)
file_content = file_content_bytes.decode('utf-8')
for line in file_content.splitlines():
print(line)
Para obtener más información, consulta la documentación oficial y las páginas de precios.
Estamos implementando el modo por lotes para la API de Gemini hoy y mañana para todos los usuarios. Este es solo el comienzo del procesamiento por lotes y estamos trabajando activamente para ampliar sus capacidades. ¡Mantente al tanto de las opciones más potentes y flexibles!
Build with Veo 3, now available in the Gemini API
Simplify your Agent "vibe building" flow with ADK and Gemini CLI
Unlock Gemini’s reasoning: A step-by-step guide to logprobs on Vertex AI