7 结果
2025年6月26日 / Gemma
Gemma 3n 模型已经全面发布,在既往 Gemma 模型的成功基础上进一步提升,并以前所未有的性能为边缘设备带来先进的设备端多模态功能。欢迎探索 Gemma 3n 的创新,包括其移动设备优先架构、MatFormer 技术、分层嵌入、KV 缓存共享以及新的音频和 MobileNet-V5 视觉编码器,并了解开发者如何立即开始使用它进行构建。
2025年6月24日 / Gemini
Gemini 2.5 Pro 和 Flash 正在通过增强编码、推理以及包括空间理解在内的多模态能力,推动机器人技术的变革。这些模型将用于理解语义场景、生成机器人控制代码,以及使用 Live API 构建交互式应用。同时,这些模型也高度重视安全性提升与社区应用。
2025年5月20日 / Gemma
Gemma 3n 是一款尖端的开源模型,专为设备端的快速多模态人工智能而设计,具有优化的性能、独特的二合一模型灵活性,以及增强的音频多模态理解能力,使开发人员能够构建实时交互式应用程序和复杂的以音频为中心的体验。
2025年5月9日 / DeepMind
Gemini 2.5 实现视频理解的重大飞跃,不仅在多项关键基准测试中表现出众,还能无缝结合使用视听信息、代码以及其他数据格式。
2025年4月30日 / Gemma
Gemma 3 的全新功能包括视觉语言能力,以及为提升内存效率和处理更长上下文而进行的架构改进,相较于之前的 Gemma 模型有了显著提升。
2025年4月23日 / Gemini
探索适用于 Gemini 模型的 Live API 的实际应用场景,该 API 已全新升级,新增多项增强功能,包括对实时音频、视频和文本处理的支持、改进的会话管理、对互动的更精细控制以及更丰富的输出选项。
2024年11月20日 / Gemini
OpusClip 利用 Gemini 1.5 Flash 的多模态功能来增强视频理解和简化内容创建,从而达到节省成本和提高互动度的目的。