本地部署小模型用于翻译任务,qwen系列小模型表现横评,及个人电脑本地部署方案
- 内容介绍
- 文章标签
- 相关推荐
问题描述:
前言
作为在读学生,前段时间经常在捣鼓本地部署翻译模型,恰逢始皇发布悬赏,终于有机会在大佬云集的L站发布第一篇自己研究的内容了,也算作是2级飞升3级的“毕业论文”了
image106×122 2.11 KB
翻译效果我个人觉得非常具有主观性,在意思正确的情况下有的人可能就喜欢更加简洁的,有的人就喜欢掰开揉碎的,没有一个标准就很难做最后的测试总结,包括我看之前别人对翻译模型的测评,也基本都有很强的主观色彩,或者干脆就把只要不是很拉胯的翻译都全部放出来让大家自己根据自己喜欢选择了,始皇是如此回答的
悬赏:自部署小模型对于翻译任务的能力测评准确性是第一位,其他不强求。
既然如此,那就是在意思传达正确的前提下,比较各模型的性能表现,以此推出以下的性能指标
性能指标
- 准确性:这里分为客观和主观,客观评价将使用GPT对翻译内容进行评估打分,主观则直接放出翻译内容,供用户自己选择喜欢的语言风格的模型使用。
问题描述:
前言
作为在读学生,前段时间经常在捣鼓本地部署翻译模型,恰逢始皇发布悬赏,终于有机会在大佬云集的L站发布第一篇自己研究的内容了,也算作是2级飞升3级的“毕业论文”了
image106×122 2.11 KB
翻译效果我个人觉得非常具有主观性,在意思正确的情况下有的人可能就喜欢更加简洁的,有的人就喜欢掰开揉碎的,没有一个标准就很难做最后的测试总结,包括我看之前别人对翻译模型的测评,也基本都有很强的主观色彩,或者干脆就把只要不是很拉胯的翻译都全部放出来让大家自己根据自己喜欢选择了,始皇是如此回答的
悬赏:自部署小模型对于翻译任务的能力测评准确性是第一位,其他不强求。
既然如此,那就是在意思传达正确的前提下,比较各模型的性能表现,以此推出以下的性能指标
性能指标
- 准确性:这里分为客观和主观,客观评价将使用GPT对翻译内容进行评估打分,主观则直接放出翻译内容,供用户自己选择喜欢的语言风格的模型使用。

