【开源】ByeType — 基于OMNI多模态大模型、通过Markdown 完全定义属于你自己的AI 语音输入法,支持macOSWindowsiOS
- 内容介绍
- 文章标签
- 相关推荐
问题描述:
github.com
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
- 我的帖子已经打上 开源推广 标签: 是
- 我的开源项目完整开源,无未开源部分: 是
- 我的开源项目已链接认可 LINUX DO 社区: 是
- 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
- 以上选择我承诺是永久有效的,接受社区和佬友监督: 是
GitHub - lixiaojie001/byetype: ByeType 是一个 Markdown 驱动的 AI...
ByeType 是一个 Markdown 驱动的 AI 语音输入工具,用多模态大模型直接处理原始音频。编辑 Markdown 文件即可自定义专有词汇、转录规则和格式化策略,人名、术语、口水词、数字格式一次转录到位,减少二次修改。支持 macOS、Windows 和 iOS。
语音输入法该是什么样的?
语音输入应该是说完就能用的,不需要说完再花几分钟改错别字、加标点、调格式。但现实是,试遍了豆包、微信、讯飞,还有各种Whisper驱动的输入法,没有一个能做到。人名永远打错,术语全是谐音,口水词一个不漏,说完还是得靠键盘擦屁股。
所以我做了ByeType。思路很简单:现在的多模态大模型能直接听懂音频,那我把转录规则、词汇表写成提示词喂给它,让它一步到位,不就行了?
直接看对比。
问题描述:
github.com
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
- 我的帖子已经打上 开源推广 标签: 是
- 我的开源项目完整开源,无未开源部分: 是
- 我的开源项目已链接认可 LINUX DO 社区: 是
- 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
- 以上选择我承诺是永久有效的,接受社区和佬友监督: 是
GitHub - lixiaojie001/byetype: ByeType 是一个 Markdown 驱动的 AI...
ByeType 是一个 Markdown 驱动的 AI 语音输入工具,用多模态大模型直接处理原始音频。编辑 Markdown 文件即可自定义专有词汇、转录规则和格式化策略,人名、术语、口水词、数字格式一次转录到位,减少二次修改。支持 macOS、Windows 和 iOS。
语音输入法该是什么样的?
语音输入应该是说完就能用的,不需要说完再花几分钟改错别字、加标点、调格式。但现实是,试遍了豆包、微信、讯飞,还有各种Whisper驱动的输入法,没有一个能做到。人名永远打错,术语全是谐音,口水词一个不漏,说完还是得靠键盘擦屁股。
所以我做了ByeType。思路很简单:现在的多模态大模型能直接听懂音频,那我把转录规则、词汇表写成提示词喂给它,让它一步到位,不就行了?

