佬友们有什么比较适合评估大模型多轮回答问题的新颖性、易懂性之类指标的项目吗
- 内容介绍
- 文章标签
- 相关推荐
问题描述:
--【壹】--:
最近在跑baseline,找不到合适的评估模型,复现的论文跑评估需要reference answer他没给。所以想找一个其他的评估模型。复现的论文用的评估模型是 Prometheus 2.佬友们有什么建议吗?
网友解答:--【壹】--:
佬友们帮帮
问题描述:
--【壹】--:
最近在跑baseline,找不到合适的评估模型,复现的论文跑评估需要reference answer他没给。所以想找一个其他的评估模型。复现的论文用的评估模型是 Prometheus 2.佬友们有什么建议吗?
网友解答:--【壹】--:
佬友们帮帮

