一个小例子,简单测试各大模型的网页画图能力
- 内容介绍
- 文章标签
- 相关推荐
Prompt 就是给定一道数学题,然后用 HTML SVG 画一个示意图。
测试不严谨,大伙大概看个乐就行。
省流:
- GLM-5.1 和 Claude Opus 4.6 同属第一梯队,并且思考 token 少一半
- GLM-5-turbo 比 GLM 5 强一些
- GPT-5.4 拉完了
GLM 4.7
- 思考 3 秒
- 输出 tokens:4.9 k
- 总耗时:2m 30s
- 生成速度:32.6T/s(不知道为什么这么慢,理论上 4.7 平时很快的)
image1502×828 72.7 KB
评价:基本上没思考,直接开始写,效果一般,问题很多。
打分:50 分
GLM 5
- 思考 15 秒
- 输出 tokens:5.4 k
- 总耗时:1m 46s
- 生成速度:50.9T/s
image1362×830 57.9 KB
评价:美观程度有所上升,但是存在遮挡。
打分:60 分
GLM-5-turbo
- 思考 7 秒
- 输出 tokens:5.9 k
- 总耗时:1m 59s
- 生成速度:49.3T/s
image1374×992 100 KB
评价:美观程度比 GLM 5 更好一些,并且元素也不遮挡了。
打分:80 分
GLM-5.1
- 思考 634 秒
- 输出 tokens:18.7 k
- 总耗时:10m 50s
- 生成速度:28.7T/s
image1720×1130 130 KB
评价:思考时间了足足 10 分钟,但是最后效果也是非常好的
打分:93 分
GPT-5.4
- 思考 126 秒
- 输出 tokens:15.3 k
- 总耗时:3m 1s
- 生成速度:84.6T/s
image1594×1018 156 KB
评价:不知道在干什么,思考了 2 分钟,还是一坨,拉完了
打分:40 分
Gemini 3.1 Pro
- 思考 62 秒
- 输出 tokens:18.3 k
- 总耗时:1m 47s
- 生成速度:170.4T/s
image1472×846 70.7 KB
评价:整体看起来还算舒服,不杂乱,但没有精致感
打分:85 分
Claude Opus 4.6
- 思考 333 秒
- 输出 tokens:27.8 k
- 总耗时:6m 31s
- 生成速度:71.0T/s
image1530×842 79.7 KB
评价:很美观,元素位置都很精准,看起来很舒服,但没有体现五点法
打分:95 分
Claude Sonnet 4.6
- 思考 1263 秒
- 输出 tokens:102.9 k
- 总耗时:21m 30s
- 生成速度:79.7T/s
image1844×820 63.1 KB
评价:画得倒没太大问题,但你这时间和 token 消耗,是认真的吗?
打分:92 分
总结:
| 模型 | 总耗时 | 输出 tokens | 成本 | 分数 | 性价比 | 推荐星数 |
|---|---|---|---|---|---|---|
| GLM-4.7 | 2m30s | 4.9k | $0.011 | 50 | 46.4 | ★★☆☆☆ |
| GLM-5 | 1m46s | 5.4k | $0.017 | 60 | 34.7 | ★★★☆☆ |
| GLM-5-Turbo | 1m59s | 5.9k | $0.024 | 80 | 33.9 | ★★★★☆ |
| GLM-5.1 | 10m50s | 18.7k | $0.060 | 93 | 15.5 | ★★★★★ |
| GPT-5.4 | 3m01s | 15.3k | $0.23 | 40 | 1.74 | ★☆☆☆☆ |
| Gemini 3.1 Pro | 1m47s | 18.3k | $0.22 | 85 | 3.87 | ★★★☆☆ |
| Claude Opus 4.6 | 6m31s | 27.8k | $0.70 | 95 | 1.37 | ★★★★★ |
| Claude Sonnet 4.6 | 21m30s | 102.9k | $1.5 | 92 | 0.60 | ★★★☆☆ |
--【壹】--:
glm 5.1居然这么强? gpt画图能力确实一直是聊胜于无,但数理推导还是太扎实了以至于不得不用(仅凭这一点就足以在我的工作流中取代其他所有模型,包括 opus)
--【贰】--:
综合下来,gemini性价比最高,在短暂的时间内花费不多还能完成的不错
--【叁】--:
glm-5.1没想到这么强啊
--【肆】--:
gpt这画的什么垃圾
--【伍】--:
GPT任何涉及到多模态的地方都很垃圾,奥特曼不知道在干啥
--【陆】--:
哈哈哈
有原题吗
--【柒】--:
很离谱,我还以为是 5.4 能力倒退了,结果试了一下,5.2 和 5.3 更垃圾
--【捌】--:
原题比较乱,我就是随便写了一坨扔进去,让它用 Chatwise 的 Artifacts 来画
Prompt 就是给定一道数学题,然后用 HTML SVG 画一个示意图。
测试不严谨,大伙大概看个乐就行。
省流:
- GLM-5.1 和 Claude Opus 4.6 同属第一梯队,并且思考 token 少一半
- GLM-5-turbo 比 GLM 5 强一些
- GPT-5.4 拉完了
GLM 4.7
- 思考 3 秒
- 输出 tokens:4.9 k
- 总耗时:2m 30s
- 生成速度:32.6T/s(不知道为什么这么慢,理论上 4.7 平时很快的)
image1502×828 72.7 KB
评价:基本上没思考,直接开始写,效果一般,问题很多。
打分:50 分
GLM 5
- 思考 15 秒
- 输出 tokens:5.4 k
- 总耗时:1m 46s
- 生成速度:50.9T/s
image1362×830 57.9 KB
评价:美观程度有所上升,但是存在遮挡。
打分:60 分
GLM-5-turbo
- 思考 7 秒
- 输出 tokens:5.9 k
- 总耗时:1m 59s
- 生成速度:49.3T/s
image1374×992 100 KB
评价:美观程度比 GLM 5 更好一些,并且元素也不遮挡了。
打分:80 分
GLM-5.1
- 思考 634 秒
- 输出 tokens:18.7 k
- 总耗时:10m 50s
- 生成速度:28.7T/s
image1720×1130 130 KB
评价:思考时间了足足 10 分钟,但是最后效果也是非常好的
打分:93 分
GPT-5.4
- 思考 126 秒
- 输出 tokens:15.3 k
- 总耗时:3m 1s
- 生成速度:84.6T/s
image1594×1018 156 KB
评价:不知道在干什么,思考了 2 分钟,还是一坨,拉完了
打分:40 分
Gemini 3.1 Pro
- 思考 62 秒
- 输出 tokens:18.3 k
- 总耗时:1m 47s
- 生成速度:170.4T/s
image1472×846 70.7 KB
评价:整体看起来还算舒服,不杂乱,但没有精致感
打分:85 分
Claude Opus 4.6
- 思考 333 秒
- 输出 tokens:27.8 k
- 总耗时:6m 31s
- 生成速度:71.0T/s
image1530×842 79.7 KB
评价:很美观,元素位置都很精准,看起来很舒服,但没有体现五点法
打分:95 分
Claude Sonnet 4.6
- 思考 1263 秒
- 输出 tokens:102.9 k
- 总耗时:21m 30s
- 生成速度:79.7T/s
image1844×820 63.1 KB
评价:画得倒没太大问题,但你这时间和 token 消耗,是认真的吗?
打分:92 分
总结:
| 模型 | 总耗时 | 输出 tokens | 成本 | 分数 | 性价比 | 推荐星数 |
|---|---|---|---|---|---|---|
| GLM-4.7 | 2m30s | 4.9k | $0.011 | 50 | 46.4 | ★★☆☆☆ |
| GLM-5 | 1m46s | 5.4k | $0.017 | 60 | 34.7 | ★★★☆☆ |
| GLM-5-Turbo | 1m59s | 5.9k | $0.024 | 80 | 33.9 | ★★★★☆ |
| GLM-5.1 | 10m50s | 18.7k | $0.060 | 93 | 15.5 | ★★★★★ |
| GPT-5.4 | 3m01s | 15.3k | $0.23 | 40 | 1.74 | ★☆☆☆☆ |
| Gemini 3.1 Pro | 1m47s | 18.3k | $0.22 | 85 | 3.87 | ★★★☆☆ |
| Claude Opus 4.6 | 6m31s | 27.8k | $0.70 | 95 | 1.37 | ★★★★★ |
| Claude Sonnet 4.6 | 21m30s | 102.9k | $1.5 | 92 | 0.60 | ★★★☆☆ |
--【壹】--:
glm 5.1居然这么强? gpt画图能力确实一直是聊胜于无,但数理推导还是太扎实了以至于不得不用(仅凭这一点就足以在我的工作流中取代其他所有模型,包括 opus)
--【贰】--:
综合下来,gemini性价比最高,在短暂的时间内花费不多还能完成的不错
--【叁】--:
glm-5.1没想到这么强啊
--【肆】--:
gpt这画的什么垃圾
--【伍】--:
GPT任何涉及到多模态的地方都很垃圾,奥特曼不知道在干啥
--【陆】--:
哈哈哈
有原题吗
--【柒】--:
很离谱,我还以为是 5.4 能力倒退了,结果试了一下,5.2 和 5.3 更垃圾
--【捌】--:
原题比较乱,我就是随便写了一坨扔进去,让它用 Chatwise 的 Artifacts 来画

