Modo por lotes en la API de Gemini: procesa más por menos

7 DE JULIO DE 2025

Lucia Loher Product Manager

Vishal Dharmadhikari Product Solutions Engineer

Los modelos Gemini ahora están disponibles en modo por lotes

Nos complace presentar un modo por lotes en la API de Gemini, un nuevo extremo asincrónico diseñado específicamente para cargas de trabajo de alto rendimiento y no críticas para la latencia. El modo por lotes de la API de Gemini te permite enviar trabajos grandes, descargar la programación y el procesamiento, y recuperar sus resultados en 24 horas, todo con un descuento del 50% en comparación con nuestras APIs sincrónicas.

Procesa más por menos

El modo por lotes es la herramienta perfecta para cualquier tarea en la que tengas tus datos listos por adelantado y no necesites una respuesta inmediata. Al separar estos grandes trabajos de tu tráfico en tiempo real, puedes aprovechar tres beneficios clave:

Ahorro de costos: los trabajos por lotes tienen un precio 50% menor que la tarifa estándar para un modelo determinado

Mayor rendimiento: el modo por lotes tiene límites de velocidad aún más altos

Llamadas a la API simples: no es necesario administrar colas complejas del lado del cliente ni reintentar la lógica. Los resultados disponibles se devuelven en un plazo de 24 horas.

Un flujo de trabajo simple para trabajos grandes

Diseñamos la API para que sea simple e intuitiva. Tú empaquetas todas las solicitudes en un solo archivo, lo envías y obtienes tus resultados una vez que el trabajo está completo. Estas son algunas formas en que los desarrolladores están aprovechando el modo por lotes para las tareas actuales:

Generación y procesamiento de contenido masivo: Reforged Labs, que se especializa en la comprensión profunda de videos, utiliza Gemini 2.5 Pro para analizar y etiquetar grandes cantidades de anuncios de video mensualmente. La implementación del modo por lotes revolucionó sus operaciones, ya que redujo significativamente los costos, aceleró el procesamiento de los entregables del cliente y permitió la escalabilidad masiva necesaria para obtener información significativa del mercado.

Evaluaciones de modelos: Vals AI compara modelos de base en casos de uso del mundo real, incluyendo casos legales, financieros, fiscales y sanitarios. Utiliza el modo por lotes para enviar grandes volúmenes de consultas de evaluación sin estar restringidos por los límites de frecuencia.

Comienza con solo unas pocas líneas de código

Puedes comenzar a usar el modo por lotes hoy mismo con el SDK de Python de Google GenAI:

# Crea un JSONL que contenga estas líneas:
# {"key": "request_1", "request": {"contents": [{"parts": [{"text": "Explain how AI works in a few words"}]}]}},
# {"key": "request_2", "request": {"contents": [{"parts": [{"text": "Explain how quantum computing works in a few words"}]}]}}
 
uploaded_batch_requests = client.files.upload(file="batch_requests.json")
 
batch_job = client.batches.create(
    model="gemini-2.5-flash",
    src=uploaded_batch_requests.name,
    config={
        'display_name': "batch_job-1",
    },
)
 
print(f"Created batch job: {batch_job.name}")
 
# Espera 24 horas
 
if batch_job.state.name == 'JOB_STATE_SUCCEEDED':
    result_file_name = batch_job.dest.file_name
    file_content_bytes = client.files.download(file=result_file_name)
    file_content = file_content_bytes.decode('utf-8')
 
    for line in file_content.splitlines():
      print(line)

Python

Para obtener más información, consulta la documentación oficial y las páginas de precios.

Lee la documentación

Consulta la guía paso a paso

Ver precios

Estamos implementando el modo por lotes para la API de Gemini hoy y mañana para todos los usuarios. Este es solo el comienzo del procesamiento por lotes y estamos trabajando activamente para ampliar sus capacidades. ¡Mantente al tanto de las opciones más potentes y flexibles!

Publicaciones relacionadas

Gemini Google AI Studio AI Announcements

Build with Veo 3, now available in the Gemini API

17 DE JULIO DE 2025

Gemini AI How-To Guides Announcements

Simplify your Agent "vibe building" flow with ADK and Gemini CLI

16 DE JULIO DE 2025

AI Cloud Tutorials How-To Guides

Unlock Gemini’s reasoning: A step-by-step guide to logprobs on Vertex AI

16 DE JULIO DE 2025