【开源自荐】说"PostgreSQL"给我转成"泼斯特格瑞赛口",忍不了了,自己做了个语音输入法,连标点符号都能定制,支持 macOSWindowsiOS

2026-04-11 15:020阅读0评论SEO基础
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:

  • 我的帖子已经打上 开源推广 标签:
  • 我的开源项目完整开源,无未开源部分:
  • 我的开源项目已链接认可 LINUX DO 社区:
  • 我帖子内的项目介绍,AI生成、润色内容部分已截图发出:
  • 以上选择我承诺是永久有效的,接受社区和佬友监督:

github.com

GitHub - lixiaojie001/byetype: ByeType 是一个 Markdown 驱动的 AI...

ByeType 是一个 Markdown 驱动的 AI 语音输入工具,用多模态大模型直接处理原始音频。编辑 Markdown 文件即可自定义专有词汇、转录规则和格式化策略,人名、术语、口水词、数字格式一次转录到位,减少二次修改。支持 macOS、Windows 和 iOS。

做这个工具的起因很简单:平时工作要写大量文字,试过各种语音输入,体验都很糟糕。人名永远打错,“张昱"变成"张宇”,“覃旻"变成"秦敏”;技术术语全是谐音,“PostgreSQL"变成"泼斯特格瑞赛口”,“Kubernetes"变成"库伯内提斯”;口水词一个不漏,“嗯”“那个”"就是说"全保留在里面。每次说完还得花好几分钟逐字修改,效率反而更低了。

后来想到一个思路:现在的多模态大模型已经能直接听懂音频了,为什么不把识别规则、专有词汇这些东西写成提示词,让模型在转录的时候一步到位?不需要先转成文字再用另一个模型纠错,一次就搞定。

于是做了 ByeType。