Gemini
Google 的多模态大语言模型系列,原生支持文本、图像、音频、视频理解。
版本
| 版本 | 特点 |
|---|---|
| Gemini 1.0 | 多模态基础版 |
| Gemini 1.5 | 长上下文(1M token) |
| Gemini 2.0 | Agent 能力增强 |
| Gemini-VLM | 视觉版本 |
相关
- GPT-4V — 竞争者
- multimodal-models — 多模态总览
- foundation-models — 基础模型
Google 的多模态大语言模型系列,原生支持文本、图像、音频、视频理解。
| 版本 | 特点 |
|---|---|
| Gemini 1.0 | 多模态基础版 |
| Gemini 1.5 | 长上下文(1M token) |
| Gemini 2.0 | Agent 能力增强 |
| Gemini-VLM | 视觉版本 |