modelaudiospeechtranscriptionopenai type: entity 创建: 2026-04-27 更新: 2026-04-27

Whisper

OpenAI 开源的语音识别模型，支持多语言转录和翻译。

特点

多语言支持（99+ 语言）
强鲁棒性
开源 Apache 2.0

模型规模

模型	参数量	速度
tiny	39M	最快
base	74M	快
small	244M	中
medium	769M	较慢
large	1550M	最慢

游戏开发应用

NPC 语音对话输入
游戏内语音指令识别
音频日志转录

相关

audio-generation — 音频生成
Whisper — 同名（大小写不敏感）