Whisper
OpenAI 开源的语音识别模型,支持多语言转录和翻译。
特点
- 多语言支持(99+ 语言)
- 强鲁棒性
- 开源 Apache 2.0
模型规模
| 模型 | 参数量 | 速度 |
|---|---|---|
| tiny | 39M | 最快 |
| base | 74M | 快 |
| small | 244M | 中 |
| medium | 769M | 较慢 |
| large | 1550M | 最慢 |
游戏开发应用
- NPC 语音对话输入
- 游戏内语音指令识别
- 音频日志转录
相关
- audio-generation — 音频生成
- Whisper — 同名(大小写不敏感)
OpenAI 开源的语音识别模型,支持多语言转录和翻译。
| 模型 | 参数量 | 速度 |
|---|---|---|
| tiny | 39M | 最快 |
| base | 74M | 快 |
| small | 244M | 中 |
| medium | 769M | 较慢 |
| large | 1550M | 最慢 |