20 결과
2025년 7월 17일 / Gemini
Veo 3, Google’s latest AI video generation model, is now available in paid preview via the Gemini API and Google AI Studio. Unveiled at Google I/O 2025, Veo 3 can generate both video and synchronized audio, including dialogue, background sounds, and even animal noises. This model delivers realistic visuals, natural lighting, and physics, with accurate lip syncing and sound that matches on-screen action.
2025년 7월 16일 / AI
The `logprobs` feature has been officially introduced in the Gemini API on Vertex AI, provides insight into the model's decision-making by showing probability scores for chosen and alternative tokens. This step-by-step guide will walk you through how to enable and interpret this feature and apply it to powerful use cases such as confident classification, dynamic autocomplete, and quantitative RAG evaluation.
2025년 7월 14일 / Gemini
The Gemini Embedding text model is now generally available in the Gemini API and Vertex AI. This versatile model has consistently ranked #1 on the MTEB Multilingual leaderboard since its experimental launch in March, supports over 100 languages, has a 2048 maximum input token length, and is priced at $0.15 per 1M input tokens.
2025년 7월 10일 / Gemini
GenAI 프로세서는 Google DeepMind의 새로운 오픈소스 Python 라이브러리입니다. 원활한 체이닝과 동시 실행을 위해 입력 처리부터 모델 호출 및 출력 처리까지 모든 단계를 위한 일관된 'Processor' 인터페이스를 제공함으로써 AI 애플리케이션, 특히 멀티모달 입력을 처리하고 실시간 응답성을 요하는 애플리케이션 개발을 간소화할 수 있도록 설계되었습니다.
2025년 7월 7일 / Gemini
Gemini API의 새로운 일괄 모드는 처리량이 많고 지연 시간이 중요하지 않은 AI 워크로드를 위해 설계되었습니다. 일괄 모드는 예약 및 처리를 수행하여 대규모 작업을 단순화하고 데이터 분석, 대규모 콘텐츠 생성, 모델 평가와 같은 작업을 한층 비용 효율적이고 확장 가능하게 만들어 개발자가 대량의 데이터를 효율적으로 처리할 수 있게 합니다.
2025년 6월 24일 / Gemini
Gemini 2.5 Pro 및 Flash는 코딩, 추론, 멀티모달 기능(공간 이해 능력 포함)을 강화하여 로봇 공학에 변화를 일으키고 있습니다. 해당 모델은 의미론적 장면 이해, 로봇 제어용 코드 생성, Live API를 통한 인터랙티브 애플리케이션 빌드를 위해 사용되며, 안전성을 개선하고 커뮤니티를 위해 기술을 활용하는 데 중점을 두고 있습니다.
2025년 6월 24일 / Gemini
Google의 고급 텍스트-이미지 모델인 Imagen 4를 이제 Gemini API와 Google AI Studio에서 유료 미리보기로 사용할 수 있습니다. 특히 이미지 내 텍스트 생성에 대해 상당히 향상된 수준의 품질을 제공합니다. Imagen 4 제품군에는 일반 작업을 위한 Imagen 4와 고정밀 프롬프트 준수를 위한 Imagen 4 Ultra가 포함되어 있으며, 생성된 모든 이미지에는 보이지 않는 SynthID 워터마크가 있습니다.
2025년 5월 28일 / Gemini
Magic Mirror 프로젝트는 Live API, 함수 호출, Google 검색으로 그라운딩 등 Gemini API를 활용하여 역동적인 대화형 환경을 만듭니다. 이 과정에서 익숙한 객체를 통해 시각 자료를 생성하고 이야기를 전달하며 실시간 정보를 제공하는 Gemini 모델의 힘을 보여줍니다.
2025년 5월 9일 / DeepMind
Gemini 2.5는 주요 동영상 이해 벤치마크에서 최첨단 성능을 달성하고 코드 및 기타 데이터 형식을 이용해 시청각 정보를 원활하게 활용하며 동영상 이해의 중대한 도약을 보여주었습니다.
2025년 5월 8일 / Gemini
Gemini API의 암시적 캐싱 기능 출시로 기존의 명시적 캐싱 API가 확장되어 '상시 작동' 캐싱 시스템을 제공합니다. 이 시스템은 Gemini 2.5 모델을 사용하는 개발자에게 자동으로 비용 절감 효과를 제공하고 보장된 비용 절감을 위해 명시적 캐싱 API를 계속 사용할 수 있도록 합니다.