TinyLLaMA 1B 参数的开源 LLM 小模型,适合在资源受限环境运行。 特点 仅 1B 参数 可以在手机/边缘设备运行 支持多种量化格式 相关 LLaMA — 基础系列 llm-inference — 推理优化 mlc-llm — 设备端推理