7 resultados
Filtrar por
26 DE JUNIO DE 2025 / Gemma
El modelo Gemma 3n se lanzó por completo, aprovechando el éxito de los modelos Gemma anteriores y brindando capacidades multimodales integradas y avanzadas a dispositivos perimetrales con un rendimiento sin precedentes. Explora las innovaciones de Gemma 3n, incluida su arquitectura que prioriza los dispositivos móviles, la tecnología MatFormer, incorporaciones por capas, el uso compartido de caché KV y los nuevos codificadores de audio y visión MobileNet-V5, y cómo los desarrolladores pueden comenzar a crear hoy mismo.
24 DE JUNIO DE 2025 / Gemini
Gemini 2.5 Pro y Flash están transformando la robótica a través de la mejora de la codificación, el razonamiento y las capacidades multimodales, incluida la comprensión espacial. Estos modelos se utilizan para la comprensión semántica de escenas, la generación de código para el control de robots y la creación de aplicaciones interactivas con la API Live, con un fuerte énfasis en las mejoras de seguridad y las aplicaciones comunitarias.
20 DE MAYO DE 2025 / Gemma
Gemma 3n es un modelo abierto de vanguardia, diseñado para una IA rápida y multimodal en dispositivos que ofrece un rendimiento optimizado, una flexibilidad única con un modelo 2 en 1 y una comprensión multimodal ampliada con audio, lo que permite a los desarrolladores compilar aplicaciones interactivas en vivo y sofisticadas experiencias centradas en el audio.
9 DE MAYO DE 2025 / DeepMind
Gemini 2.5 implica un gran salto en la comprensión de video, ya que logra un rendimiento de vanguardia en puntos de referencia clave de comprensión de video y puede usar sin problemas información audiovisual con código y otros formatos de datos.
30 DE ABRIL DE 2025 / Gemma
Las nuevas funciones de Gemma 3 incluyen capacidades de lenguaje-visión y cambios arquitectónicos para mejorar la eficiencia de la memoria y procesar contextos más extensos, en comparación con los modelos anteriores de Gemma.
23 DE ABRIL DE 2025 / Gemini
Explora las aplicaciones del mundo real de la API Live para los modelos de Gemini, ahora actualizados con funciones mejoradas para el procesamiento de audio, video y texto en tiempo real, administración de sesiones mejorada, control sobre las interacciones y opciones de salida más ricas.
20 DE NOVIEMBRE DE 2024 / Gemini
OpusClip usa las funciones multimodales de Gemini 1.5 Flash para mejorar la comprensión de videos y agilizar la creación de contenido, lo que lleva a un ahorro de costos y un aumento de la participación.