19 resultados
Filtrar por
17 DE JULIO DE 2025 / Gemini
Veo 3, Google’s latest AI video generation model, is now available in paid preview via the Gemini API and Google AI Studio. Unveiled at Google I/O 2025, Veo 3 can generate both video and synchronized audio, including dialogue, background sounds, and even animal noises. This model delivers realistic visuals, natural lighting, and physics, with accurate lip syncing and sound that matches on-screen action.
14 DE JULIO DE 2025 / Gemini
The Gemini Embedding text model is now generally available in the Gemini API and Vertex AI. This versatile model has consistently ranked #1 on the MTEB Multilingual leaderboard since its experimental launch in March, supports over 100 languages, has a 2048 maximum input token length, and is priced at $0.15 per 1M input tokens.
24 DE JUNIO DE 2025 / Gemini
Gemini 2.5 Pro y Flash están transformando la robótica a través de la mejora de la codificación, el razonamiento y las capacidades multimodales, incluida la comprensión espacial. Estos modelos se utilizan para la comprensión semántica de escenas, la generación de código para el control de robots y la creación de aplicaciones interactivas con la API Live, con un fuerte énfasis en las mejoras de seguridad y las aplicaciones comunitarias.
24 DE JUNIO DE 2025 / Gemini
Imagen 4, el modelo avanzado de texto a imagen de Google, ahora está disponible en versión preliminar pagada a través de la API de Gemini y Google AI Studio, y ofrece mejoras de calidad significativas, especialmente para la generación de texto dentro de las imágenes. La familia de Imagen 4 incluye Imagen 4 para tareas generales e Imagen 4 Ultra para una adherencia de alta precisión a las indicaciones, con todas las imágenes generadas con una marca de agua SynthID no visible.
23 DE MAYO DE 2025 / Gemini
Anunciamos nuevas funciones y modelos para la API de Gemini, con la introducción de Gemini 2.5 Flash Preview con un mejor razonamiento y mayor eficiencia, Gemini 2.5 Pro y Flash de texto a voz que admiten múltiples idiomas y hablantes, y el diálogo de audio nativo de Gemini 2.5 Flash para IA conversacional.
21 DE MAYO DE 2025 / Google AI Studio
Para mejorar la experiencia del desarrollador, Google AI Studio se actualizó con generación de código nativo con Gemini 2.5 Pro, herramientas agénticas y funcionalidades potenciadas de generación multimodal, además de nuevas funciones como la pestaña Build, Live API y herramientas mejoradas para crear aplicaciones de IA sofisticadas.
9 DE MAYO DE 2025 / Cloud
Revisa los anuncios de la Games Developer Conference (GDC) de este año. Explora cómo los modelos de Gemma y Gemini pueden ayudar a crear experiencias de IA en los juegos con el lanzamiento de Gemma 3, el complemento de Unity y su aplicación en un juego de muestra, y cómo expandir juegos con IA generativa en Google Cloud.
9 DE MAYO DE 2025 / DeepMind
Gemini 2.5 implica un gran salto en la comprensión de video, ya que logra un rendimiento de vanguardia en puntos de referencia clave de comprensión de video y puede usar sin problemas información audiovisual con código y otros formatos de datos.
8 DE MAYO DE 2025 / Gemini
El lanzamiento del almacenamiento en caché implícito en la API de Gemini amplía la API de almacenamiento en caché explícito existente y proporciona un sistema de almacenamiento en caché “siempre activo” que ofrece ahorros de costos automáticos a los desarrolladores que utilizan los modelos de Gemini 2.5 y la disponibilidad continua de la API de almacenamiento en caché explícito a fin de garantizar ahorros.
7 DE MAYO DE 2025 / Gemini
Las capacidades de generación de imágenes de Gemini 2.0 Flash, ahora disponibles en versión preliminar en Google AI Studio y Vertex AI, incluyen límites de velocidad más altos, calidad visual mejorada, representación de texto más precisa, entre otras mejoras, lo que permite a los desarrolladores crear aplicaciones para la recontextualización de productos, la edición colaborativa de imágenes y la generación dinámica de SKU.