모델
Google Gemini
Google DeepMind의 멀티모달 파운데이션 모델 계열로 텍스트, 이미지, 오디오, 영상을 처리하며 Gemini 앱, Workspace, Vertex AI를 구동합니다.
Google Gemini는 Google DeepMind가 구축하는 멀티모달 파운데이션 모델 계열로, 2023년 12월 이전 PaLM과 LaMDA 계열의 후속으로 발표되었습니다. Gemini는 처음부터 네이티브 멀티모달이 되도록 설계되었습니다. 텍스트, 이미지, 오디오, 영상, 코드를 단일 대규모 언어 모델 (LLM) 안에서 처리하며, 텍스트 모델에 모달리티를 사후에 “붙이는” 방식이 아닙니다.
라인업은 여러 단계를 아우릅니다. Gemini Nano는 디바이스에서 동작하고, Flash는 고처리량 클라우드 추론을 겨냥하며, Pro는 일상 업무용 주력, Ultra/Advanced는 GPT와 Claude와 함께 프론티어에 서 있습니다. 후속 버전 — Gemini 1.5, 2.0, 2.5 — 은 컨텍스트를 100만 토큰 이상으로 확장하고, 네이티브 도구 사용을 추가했으며, 브라우저와 코드베이스를 다룰 수 있는 AI 에이전트로 성숙했습니다.
Gemini는 동명의 소비자 앱, Google Workspace(Docs, Gmail, Sheets, Meet)의 AI 기능, Android 어시스턴트, 개발자용 Vertex AI 플랫폼을 구동합니다. Google은 또한 Gemma도 제공합니다 — Gemini와 아키텍처 아이디어를 공유하지만 오픈소스 커뮤니티를 위해 만들어진 오픈 가중치 파생 모델입니다.