GPT-4V OpenAI GPT-4 with Vision,多模态大模型,支持图像理解。 特点 图像理解分析 文档 OCR 图表解读 视觉问答 相关 Gemini — Google 竞争者 LLaVA — 开源替代 multimodal-models — 多模态总览