寻求语音识别可区分发言人的开源技术手段
- 内容介绍
- 文章标签
- 相关推荐
RT
最近在找一款可开源部署的 区分发言人的语音识别项目
有没有佬友推荐一下
--【壹】--:
有,kaldi k2.
GitHub - k2-fsa/sherpa-onnx: Speech-to-text, text-to-speech, speaker...
Speech-to-text, text-to-speech, speaker diarization, speech enhancement, source separation, and VAD using next-gen Kaldi with onnxruntime without Internet connection. Support embedded systems, Android, iOS, HarmonyOS, Raspberry Pi, RISC-V, RK NPU, Axera NPU, Ascend NPU, x86_64 servers, websocket server/client, support 12 programming languages
image913×1034 67.1 KB
--【贰】--:
感谢 晚上布一个看看
--【叁】--:
嘶 我记得我们之前公司有用一个这个玩意 但是我记不得了
--【肆】--:
开源的最简单的不就是pyannote吗
很大一部分都是基于这个魔改的
然后就是微软的vibevoice 也是开源的
--【伍】--:
RT
最近在找一款可开源部署的 区分发言人的语音识别项目
有没有佬友推荐一下
--【壹】--:
有,kaldi k2.
GitHub - k2-fsa/sherpa-onnx: Speech-to-text, text-to-speech, speaker...
Speech-to-text, text-to-speech, speaker diarization, speech enhancement, source separation, and VAD using next-gen Kaldi with onnxruntime without Internet connection. Support embedded systems, Android, iOS, HarmonyOS, Raspberry Pi, RISC-V, RK NPU, Axera NPU, Ascend NPU, x86_64 servers, websocket server/client, support 12 programming languages
image913×1034 67.1 KB
--【贰】--:
感谢 晚上布一个看看
--【叁】--:
嘶 我记得我们之前公司有用一个这个玩意 但是我记不得了
--【肆】--:
开源的最简单的不就是pyannote吗
很大一部分都是基于这个魔改的
然后就是微软的vibevoice 也是开源的
--【伍】--:

