大家用的什么录音转文字产品?千问?听脑?飞书?
- 内容介绍
- 文章标签
- 相关推荐
千问的音视频识别(手机录音)的收音识别太弱了、听脑做的还行 但是每天只有 20 分钟 ,对于一次 3 个小时的直接寄 ,我看到有用豆包的 有用 gemini 的 ,这些是否自建一个效果咋样 ,需求是 每次开会录音可能 3 个小时 主要是需要第一步录音转文字效果好
网友解答:--【壹】--:
我还没下载 看起来这是需要自定义api的 那就是免费使用对吗?那什么api用起来效果最好呢 这个支持3小时的转录吗
--【贰】--:
现在是自己手机或者通义等录完音之后 直接在通义转成文字 (每天 10 小时免费),然后把这个带时间的录音文字用 aistudio 带提示词 进行润色的 效果还行 就是有点麻烦 (文字太长 要分布执行)
--【叁】--:
我这边开会也说方言,我目前用豆包转换出来的效果最好
--【肆】--:
通义听悟 - 你的工作学习AI助手
阿里云通义听悟是聚焦音视频内容的工作学习AI助手,依托大模型,帮助用户记录、整理和分析音视频内容,体验用大模型做音视频笔记、整理会议记录。
如果觉得千问效果还好,可以试试通义听悟,每天十小时。
--【伍】--:
自身携带翻译的模型。3h不知道可以不可以,可以试试~
--【陆】--:
我用的这个。比wisper快好多。
千问的音视频识别(手机录音)的收音识别太弱了、听脑做的还行 但是每天只有 20 分钟 ,对于一次 3 个小时的直接寄 ,我看到有用豆包的 有用 gemini 的 ,这些是否自建一个效果咋样 ,需求是 每次开会录音可能 3 个小时 主要是需要第一步录音转文字效果好
网友解答:--【壹】--:
我还没下载 看起来这是需要自定义api的 那就是免费使用对吗?那什么api用起来效果最好呢 这个支持3小时的转录吗
--【贰】--:
现在是自己手机或者通义等录完音之后 直接在通义转成文字 (每天 10 小时免费),然后把这个带时间的录音文字用 aistudio 带提示词 进行润色的 效果还行 就是有点麻烦 (文字太长 要分布执行)
--【叁】--:
我这边开会也说方言,我目前用豆包转换出来的效果最好
--【肆】--:
通义听悟 - 你的工作学习AI助手
阿里云通义听悟是聚焦音视频内容的工作学习AI助手,依托大模型,帮助用户记录、整理和分析音视频内容,体验用大模型做音视频笔记、整理会议记录。
如果觉得千问效果还好,可以试试通义听悟,每天十小时。
--【伍】--:
自身携带翻译的模型。3h不知道可以不可以,可以试试~
--【陆】--:
我用的这个。比wisper快好多。

