- Google Developers Blog

17 DE JULIO DE 2025 / Gemini

Build with Veo 3, now available in the Gemini API

Veo 3, Google’s latest AI video generation model, is now available in paid preview via the Gemini API and Google AI Studio. Unveiled at Google I/O 2025, Veo 3 can generate both video and synchronized audio, including dialogue, background sounds, and even animal noises. This model delivers realistic visuals, natural lighting, and physics, with accurate lip syncing and sound that matches on-screen action.

16 DE JULIO DE 2025 / AI

Unlock Gemini’s reasoning: A step-by-step guide to logprobs on Vertex AI

The `logprobs` feature has been officially introduced in the Gemini API on Vertex AI, provides insight into the model's decision-making by showing probability scores for chosen and alternative tokens. This step-by-step guide will walk you through how to enable and interpret this feature and apply it to powerful use cases such as confident classification, dynamic autocomplete, and quantitative RAG evaluation.

14 DE JULIO DE 2025 / Gemini

Gemini Embedding now generally available in the Gemini API

The Gemini Embedding text model is now generally available in the Gemini API and Vertex AI. This versatile model has consistently ranked #1 on the MTEB Multilingual leaderboard since its experimental launch in March, supports over 100 languages, has a 2048 maximum input token length, and is priced at $0.15 per 1M input tokens.

10 DE JULIO DE 2025 / Gemini

Anunciamos GenAI Processors: compila aplicaciones basadas en Gemini potentes y flexibles

GenAI Processors es una nueva biblioteca Python de código abierto de Google DeepMind diseñada para simplificar el desarrollo de aplicaciones de IA, especialmente aquellas que manejan entradas multimodales y requieren capacidad de respuesta en tiempo real, al proporcionar una interfaz de “procesador” coherente para todos los pasos, desde el manejo de entradas hasta el procesamiento de llamadas y salidas de modelos, para un encadenamiento sin interrupciones y una ejecución simultánea.

Announcing GenAI Processors: Streamline your Gemini application development

7 DE JULIO DE 2025 / Gemini

Modo por lotes en la API de Gemini: procesa más por menos

El nuevo modo por lotes en la API de Gemini está diseñado para cargas de trabajo de IA de alto rendimiento y no críticas para la latencia, simplificando los trabajos grandes mediante el manejo de la programación y el procesamiento, y haciendo que tareas como el análisis de datos, la creación masiva de contenido y la evaluación de modelos sean más rentables y escalables, para que los desarrolladores puedan procesar grandes volúmenes de datos de manera eficiente.

Scale your AI workloads with batch mode in the Gemini API

24 DE JUNIO DE 2025 / Gemini

Imagen 4 ahora está disponible en la API de Gemini y Google AI Studio

Imagen 4, el modelo avanzado de texto a imagen de Google, ahora está disponible en versión preliminar pagada a través de la API de Gemini y Google AI Studio, y ofrece mejoras de calidad significativas, especialmente para la generación de texto dentro de las imágenes. La familia de Imagen 4 incluye Imagen 4 para tareas generales e Imagen 4 Ultra para una adherencia de alta precisión a las indicaciones, con todas las imágenes generadas con una marca de agua SynthID no visible.

Imagen 4 is now available on Gemini API and Google AI Studio

24 DE JUNIO DE 2025 / Gemini

Gemini 2.5 para robótica e inteligencia integrada

Gemini 2.5 Pro y Flash están transformando la robótica a través de la mejora de la codificación, el razonamiento y las capacidades multimodales, incluida la comprensión espacial. Estos modelos se utilizan para la comprensión semántica de escenas, la generación de código para el control de robots y la creación de aplicaciones interactivas con la API Live, con un fuerte énfasis en las mejoras de seguridad y las aplicaciones comunitarias.

Gemini 2.5 for robotics and embodied intelligence

28 DE MAYO DE 2025 / Gemini

”Una mirada en el espejo mágico: experiencia interactiva con modelos de Gemini

El proyecto “Espejo Mágico” utiliza la API de Gemini, e incluye la API Live, la llamada a funciones y la conexión con la Búsqueda de Google, para crear una experiencia interactiva y dinámica, y demostrar el poder de los modelos de Gemini para generar imágenes, contar historias y brindar información en tiempo real a través de un objeto familiar.

Exploring the Magic Mirror: an interactive experience powered by the Gemini models

9 DE MAYO DE 2025 / DeepMind

Ampliación de la frontera de la comprensión de video con Gemini 2.5

Gemini 2.5 implica un gran salto en la comprensión de video, ya que logra un rendimiento de vanguardia en puntos de referencia clave de comprensión de video y puede usar sin problemas información audiovisual con código y otros formatos de datos.

8 DE MAYO DE 2025 / Gemini

Los modelos de Gemini 2.5 ahora admiten almacenamiento en caché implícito

El lanzamiento del almacenamiento en caché implícito en la API de Gemini amplía la API de almacenamiento en caché explícito existente y proporciona un sistema de almacenamiento en caché “siempre activo” que ofrece ahorros de costos automáticos a los desarrolladores que utilizan los modelos de Gemini 2.5 y la disponibilidad continua de la API de almacenamiento en caché explícito a fin de garantizar ahorros.

Buscar

Tipo de contenido

Producto

Tecnología