151 결과
2025년 7월 17일 / Gemini
Veo 3, Google’s latest AI video generation model, is now available in paid preview via the Gemini API and Google AI Studio. Unveiled at Google I/O 2025, Veo 3 can generate both video and synchronized audio, including dialogue, background sounds, and even animal noises. This model delivers realistic visuals, natural lighting, and physics, with accurate lip syncing and sound that matches on-screen action.
2025년 7월 16일 / Gemini
The updated Agent Development Kit (ADK) simplifies and accelerates the process of building AI agents by providing the CLI with a deep, cost-effective understanding of the ADK framework, allowing developers to quickly ideate, generate, test, and improve functional agents through conversational prompts, eliminating friction and keeping them in a productive "flow" state.
2025년 7월 14일 / Gemini
The Gemini Embedding text model is now generally available in the Gemini API and Vertex AI. This versatile model has consistently ranked #1 on the MTEB Multilingual leaderboard since its experimental launch in March, supports over 100 languages, has a 2048 maximum input token length, and is priced at $0.15 per 1M input tokens.
2025년 7월 10일 / Cloud
Updates in Firebase Studio include new Agent modes, foundational support for the Model Context Protocol (MCP), and Gemini CLI integration, all designed to redefine AI-assisted development allow developers to create full-stack applications from a single prompt and integrate powerful AI capabilities directly into their workflow.
2025년 7월 9일 / Gemma
T5Gemma는 Gemma 2 프레임워크를 기반으로 사전 학습된 디코더 전용 모델을 변환 및 조정하여 개발된 새로운 인코더-디코더 LLM 제품군입니다. 특히 요약 및 번역같이 입력 데이터에 대한 심층적 이해가 필요한 작업을 할 때 디코더 전용 모델에 비해 뛰어난 성능과 효율성을 제공합니다.
2025년 7월 7일 / Gemini
Gemini API의 새로운 일괄 모드는 처리량이 많고 지연 시간이 중요하지 않은 AI 워크로드를 위해 설계되었습니다. 일괄 모드는 예약 및 처리를 수행하여 대규모 작업을 단순화하고 데이터 분석, 대규모 콘텐츠 생성, 모델 평가와 같은 작업을 한층 비용 효율적이고 확장 가능하게 만들어 개발자가 대량의 데이터를 효율적으로 처리할 수 있게 합니다.
2025년 6월 26일 / Gemma
이전 Gemma 모델의 성공을 기반으로 정식 출시된 Gemma 3n 모델은 전례 없는 성능으로 에지 기기에 고급 온디바이스 멀티모달 기능을 제공합니다. 모바일 우선 아키텍처, MatFormer 기술, Per-Layer Embeddings, KV Cache Sharing, 새로운 오디오와 MobileNet-V5 비전 인코더 등 Gemma 3n의 다양한 혁신뿐만 아니라 개발자가 오늘부터 바로 Gemma 3n 모델을 사용하여 개발을 시작하는 방법을 살펴보세요.
2025년 6월 26일 / AI
Google은 공개 통계 데이터를 통합한 오픈소스 지식 그래프인 Data Commons를 위한 새로운 Python 클라이언트 라이브러리를 출시했습니다. 이 라이브러리는 향상된 기능, 맞춤 설정 인스턴스 지원, 방대한 통계 변수에 대한 용이한 접근성을 제공함으로써 데이터 개발자가 Data Commons를 활용하는 방식을 개선합니다. 개발에는 The ONE Campaign이 참여했습니다.
2025년 6월 24일 / Gemini
새로운 AI 우선 Google Colab은 대화형 코딩을 위한 반복 쿼리, 자율 워크플로를 위한 차세대 Data Science Agent, 손쉬운 코드 변환 같은 기능의 개선을 통해 생산성을 향상시킵니다. 얼리 어답터들은 ML 프로젝트를 가속화하고, 코드를 더 빠르게 디버깅하며, 고품질 시각화를 손쉽게 생성하는 등 생산성을 대폭 끌어올릴 수 있었다고 전합니다.
2025년 6월 24일 / Gemini
Google의 고급 텍스트-이미지 모델인 Imagen 4를 이제 Gemini API와 Google AI Studio에서 유료 미리보기로 사용할 수 있습니다. 특히 이미지 내 텍스트 생성에 대해 상당히 향상된 수준의 품질을 제공합니다. Imagen 4 제품군에는 일반 작업을 위한 Imagen 4와 고정밀 프롬프트 준수를 위한 Imagen 4 Ultra가 포함되어 있으며, 생성된 모든 이미지에는 보이지 않는 SynthID 워터마크가 있습니다.