
记录一些语音相关大模型的东西 | 语音识别(ASR), 文字转语音(TTS), 音色转换(STS)相关的项目
问题描述:语音识别部分一、标志性的WhisperopenAI做的转录模型,开源,而且可以输出SRT。当时出来了减轻了很多字幕组的工作量。但是在今天的精度已经比不过如qwen3-asr等模型。仓库:GitHub - openaiwhisper
共收录篇相关文章

问题描述:语音识别部分一、标志性的WhisperopenAI做的转录模型,开源,而且可以输出SRT。当时出来了减轻了很多字幕组的工作量。但是在今天的精度已经比不过如qwen3-asr等模型。仓库:GitHub - openaiwhisper