modelmultimodalgooglellm type: entity 创建: 2026-04-27 更新: 2026-04-27

Gemini

Google 的多模态大语言模型系列，原生支持文本、图像、音频、视频理解。

版本

版本	特点
Gemini 1.0	多模态基础版
Gemini 1.5	长上下文（1M token）
Gemini 2.0	Agent 能力增强
Gemini-VLM	视觉版本

相关

GPT-4V — 竞争者
multimodal-models — 多模态总览
foundation-models — 基础模型