寻求语音识别可区分发言人的开源技术手段

2026-04-13 12:530阅读0评论SEO资源

内容介绍
文章标签
相关推荐

问题描述：

RT
最近在找一款可开源部署的区分发言人的语音识别项目
有没有佬友推荐一下

网友解答：

--【壹】--：

有，kaldi k2.

github.com

GitHub - k2-fsa/sherpa-onnx: Speech-to-text, text-to-speech, speaker...

Speech-to-text, text-to-speech, speaker diarization, speech enhancement, source separation, and VAD using next-gen Kaldi with onnxruntime without Internet connection. Support embedded systems, Android, iOS, HarmonyOS, Raspberry Pi, RISC-V, RK NPU, Axera NPU, Ascend NPU, x86_64 servers, websocket server/client, support 12 programming languages

image913×1034 67.1 KB

--【贰】--：

感谢晚上布一个看看

--【叁】--：

嘶我记得我们之前公司有用一个这个玩意但是我记不得了

--【肆】--：

开源的最简单的不就是pyannote吗

很大一部分都是基于这个魔改的

然后就是微软的vibevoice 也是开源的

--【伍】--：

github.com

阅读全文

标签：人工智能快问快答软件开发

问题描述：

RT
最近在找一款可开源部署的区分发言人的语音识别项目
有没有佬友推荐一下

网友解答：

--【壹】--：

有，kaldi k2.

github.com

GitHub - k2-fsa/sherpa-onnx: Speech-to-text, text-to-speech, speaker...

image913×1034 67.1 KB

--【贰】--：

感谢晚上布一个看看

--【叁】--：

嘶我记得我们之前公司有用一个这个玩意但是我记不得了

--【肆】--：

开源的最简单的不就是pyannote吗

很大一部分都是基于这个魔改的

然后就是微软的vibevoice 也是开源的

--【伍】--：

github.com

阅读全文

标签：人工智能快问快答软件开发

GitHub - k2-fsa/sherpa-onnx: Speech-to-text, text-to-speech, speaker...

相关推荐

GitHub - k2-fsa/sherpa-onnx: Speech-to-text, text-to-speech, speaker...

相关推荐