
记录一些语音相关大模型的东西 | 语音识别(ASR), 文字转语音(TTS), 音色转换(STS)相关的项目
问题描述:语音识别部分一、标志性的WhisperopenAI做的转录模型,开源,而且可以输出SRT。当时出来了减轻了很多字幕组的工作量。但是在今天的精度已经比不过如qwen3-asr等模型。仓库:GitHub - openaiwhisper
共收录篇相关文章

问题描述:语音识别部分一、标志性的WhisperopenAI做的转录模型,开源,而且可以输出SRT。当时出来了减轻了很多字幕组的工作量。但是在今天的精度已经比不过如qwen3-asr等模型。仓库:GitHub - openaiwhisper

问题描述:本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:我的帖子已经打上 开源推广 标签: 是我的开源项目完整开源,无未开源部分: 是我的开源项目已链接认可 LINUX DO 社区: 是我帖子内的项目介绍,AI生成、润