modelaudiospeechtranscriptionopenai type: entity 创建: 2026-04-27 更新: 2026-04-27

Whisper

OpenAI 开源的语音识别模型,支持多语言转录和翻译。

特点

  • 多语言支持(99+ 语言)
  • 强鲁棒性
  • 开源 Apache 2.0

模型规模

模型 参数量 速度
tiny 39M 最快
base 74M
small 244M
medium 769M 较慢
large 1550M 最慢

游戏开发应用

  • NPC 语音对话输入
  • 游戏内语音指令识别
  • 音频日志转录

相关