大家用的什么录音转文字产品?千问?听脑?飞书?

2026-04-11 10:590阅读0评论SEO资源
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

千问的音视频识别(手机录音)的收音识别太弱了、听脑做的还行 但是每天只有 20 分钟 ,对于一次 3 个小时的直接寄 ,我看到有用豆包的 有用 gemini 的 ,这些是否自建一个效果咋样 ,需求是 每次开会录音可能 3 个小时 主要是需要第一步录音转文字效果好

网友解答:
--【壹】--:

我还没下载 看起来这是需要自定义api的 那就是免费使用对吗?那什么api用起来效果最好呢 这个支持3小时的转录吗


--【贰】--:

现在是自己手机或者通义等录完音之后 直接在通义转成文字 (每天 10 小时免费),然后把这个带时间的录音文字用 aistudio 带提示词 进行润色的 效果还行 就是有点麻烦 (文字太长 要分布执行)


--【叁】--:

我这边开会也说方言,我目前用豆包转换出来的效果最好


--【肆】--:
tingwu.aliyun.com

通义听悟 - 你的工作学习AI助手

阿里云通义听悟是聚焦音视频内容的工作学习AI助手,依托大模型,帮助用户记录、整理和分析音视频内容,体验用大模型做音视频笔记、整理会议记录。

如果觉得千问效果还好,可以试试通义听悟,每天十小时。


--【伍】--:

自身携带翻译的模型。3h不知道可以不可以,可以试试~


--【陆】--:

我用的这个。比wisper快好多。