Modo por lotes en la API de Gemini: procesa más por menos

7 DE JULIO DE 2025
Lucia Loher Product Manager
Vishal Dharmadhikari Product Solutions Engineer

Los modelos Gemini ahora están disponibles en modo por lotes


Nos complace presentar un modo por lotes en la API de Gemini, un nuevo extremo asincrónico diseñado específicamente para cargas de trabajo de alto rendimiento y no críticas para la latencia. El modo por lotes de la API de Gemini te permite enviar trabajos grandes, descargar la programación y el procesamiento, y recuperar sus resultados en 24 horas, todo con un descuento del 50% en comparación con nuestras APIs sincrónicas.


Procesa más por menos

El modo por lotes es la herramienta perfecta para cualquier tarea en la que tengas tus datos listos por adelantado y no necesites una respuesta inmediata. Al separar estos grandes trabajos de tu tráfico en tiempo real, puedes aprovechar tres beneficios clave:

  • Ahorro de costos: los trabajos por lotes tienen un precio 50% menor que la tarifa estándar para un modelo determinado

  • Llamadas a la API simples: no es necesario administrar colas complejas del lado del cliente ni reintentar la lógica. Los resultados disponibles se devuelven en un plazo de 24 horas.


Un flujo de trabajo simple para trabajos grandes

Diseñamos la API para que sea simple e intuitiva. Tú empaquetas todas las solicitudes en un solo archivo, lo envías y obtienes tus resultados una vez que el trabajo está completo. Estas son algunas formas en que los desarrolladores están aprovechando el modo por lotes para las tareas actuales:

  • Generación y procesamiento de contenido masivo: Reforged Labs, que se especializa en la comprensión profunda de videos, utiliza Gemini 2.5 Pro para analizar y etiquetar grandes cantidades de anuncios de video mensualmente. La implementación del modo por lotes revolucionó sus operaciones, ya que redujo significativamente los costos, aceleró el procesamiento de los entregables del cliente y permitió la escalabilidad masiva necesaria para obtener información significativa del mercado.
Bulk content generation and processing
  • Evaluaciones de modelos: Vals AI compara modelos de base en casos de uso del mundo real, incluyendo casos legales, financieros, fiscales y sanitarios. Utiliza el modo por lotes para enviar grandes volúmenes de consultas de evaluación sin estar restringidos por los límites de frecuencia.
Model evaluations

Comienza con solo unas pocas líneas de código

Puedes comenzar a usar el modo por lotes hoy mismo con el SDK de Python de Google GenAI:

# Crea un JSONL que contenga estas líneas:
# {"key": "request_1", "request": {"contents": [{"parts": [{"text": "Explain how AI works in a few words"}]}]}},
# {"key": "request_2", "request": {"contents": [{"parts": [{"text": "Explain how quantum computing works in a few words"}]}]}}
 
uploaded_batch_requests = client.files.upload(file="batch_requests.json")
 
batch_job = client.batches.create(
    model="gemini-2.5-flash",
    src=uploaded_batch_requests.name,
    config={
        'display_name': "batch_job-1",
    },
)
 
print(f"Created batch job: {batch_job.name}")
 
# Espera 24 horas
 
if batch_job.state.name == 'JOB_STATE_SUCCEEDED':
    result_file_name = batch_job.dest.file_name
    file_content_bytes = client.files.download(file=result_file_name)
    file_content = file_content_bytes.decode('utf-8')
 
    for line in file_content.splitlines():
      print(line)
Python

Para obtener más información, consulta la documentación oficial y las páginas de precios.


Estamos implementando el modo por lotes para la API de Gemini hoy y mañana para todos los usuarios. Este es solo el comienzo del procesamiento por lotes y estamos trabajando activamente para ampliar sus capacidades. ¡Mantente al tanto de las opciones más potentes y flexibles!