一个小例子,简单测试各大模型的网页画图能力

2026-04-11 13:331阅读0评论SEO资讯
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

Prompt 就是给定一道数学题,然后用 HTML SVG 画一个示意图。

测试不严谨,大伙大概看个乐就行。

省流

  • GLM-5.1 和 Claude Opus 4.6 同属第一梯队,并且思考 token 少一半
  • GLM-5-turbo 比 GLM 5 强一些
  • GPT-5.4 拉完了

GLM 4.7

  • 思考 3 秒
  • 输出 tokens:4.9 k
  • 总耗时:2m 30s
  • 生成速度:32.6T/s(不知道为什么这么慢,理论上 4.7 平时很快的)

image1502×828 72.7 KB

评价:基本上没思考,直接开始写,效果一般,问题很多。
打分:50 分


GLM 5

  • 思考 15 秒
  • 输出 tokens:5.4 k
  • 总耗时:1m 46s
  • 生成速度:50.9T/s

image1362×830 57.9 KB

评价:美观程度有所上升,但是存在遮挡。
打分:60 分


GLM-5-turbo

  • 思考 7 秒
  • 输出 tokens:5.9 k
  • 总耗时:1m 59s
  • 生成速度:49.3T/s

image1374×992 100 KB

评价:美观程度比 GLM 5 更好一些,并且元素也不遮挡了。
打分:80 分


GLM-5.1

  • 思考 634 秒
  • 输出 tokens:18.7 k
  • 总耗时:10m 50s
  • 生成速度:28.7T/s

image1720×1130 130 KB

评价:思考时间了足足 10 分钟,但是最后效果也是非常好的
打分:93 分


GPT-5.4

  • 思考 126 秒
  • 输出 tokens:15.3 k
  • 总耗时:3m 1s
  • 生成速度:84.6T/s

image1594×1018 156 KB

评价:不知道在干什么,思考了 2 分钟,还是一坨,拉完了
打分:40 分


Gemini 3.1 Pro

  • 思考 62 秒
  • 输出 tokens:18.3 k
  • 总耗时:1m 47s
  • 生成速度:170.4T/s

image1472×846 70.7 KB

评价:整体看起来还算舒服,不杂乱,但没有精致感
打分:85 分


Claude Opus 4.6

  • 思考 333 秒
  • 输出 tokens:27.8 k
  • 总耗时:6m 31s
  • 生成速度:71.0T/s

image1530×842 79.7 KB

评价:很美观,元素位置都很精准,看起来很舒服,但没有体现五点法
打分:95 分


Claude Sonnet 4.6

  • 思考 1263 秒
  • 输出 tokens:102.9 k
  • 总耗时:21m 30s
  • 生成速度:79.7T/s

image1844×820 63.1 KB

评价:画得倒没太大问题,但你这时间和 token 消耗,是认真的吗?
打分:92 分


总结:

模型 总耗时 输出 tokens 成本 分数 性价比 推荐星数
GLM-4.7 2m30s 4.9k $0.011 50 46.4 ★★☆☆☆
GLM-5 1m46s 5.4k $0.017 60 34.7 ★★★☆☆
GLM-5-Turbo 1m59s 5.9k $0.024 80 33.9 ★★★★☆
GLM-5.1 10m50s 18.7k $0.060 93 15.5 ★★★★★
GPT-5.4 3m01s 15.3k $0.23 40 1.74 ★☆☆☆☆
Gemini 3.1 Pro 1m47s 18.3k $0.22 85 3.87 ★★★☆☆
Claude Opus 4.6 6m31s 27.8k $0.70 95 1.37 ★★★★★
Claude Sonnet 4.6 21m30s 102.9k $1.5 92 0.60 ★★★☆☆
网友解答:
--【壹】--:

glm 5.1居然这么强? gpt画图能力确实一直是聊胜于无,但数理推导还是太扎实了以至于不得不用(仅凭这一点就足以在我的工作流中取代其他所有模型,包括 opus)


--【贰】--:

综合下来,gemini性价比最高,在短暂的时间内花费不多还能完成的不错


--【叁】--:

glm-5.1没想到这么强啊


--【肆】--:

gpt这画的什么垃圾


--【伍】--:

GPT任何涉及到多模态的地方都很垃圾,奥特曼不知道在干啥


--【陆】--:

哈哈哈
有原题吗


--【柒】--:

很离谱,我还以为是 5.4 能力倒退了,结果试了一下,5.2 和 5.3 更垃圾


--【捌】--:

原题比较乱,我就是随便写了一坨扔进去,让它用 Chatwise 的 Artifacts 来画

标签:人工智能
问题描述:

Prompt 就是给定一道数学题,然后用 HTML SVG 画一个示意图。

测试不严谨,大伙大概看个乐就行。

省流

  • GLM-5.1 和 Claude Opus 4.6 同属第一梯队,并且思考 token 少一半
  • GLM-5-turbo 比 GLM 5 强一些
  • GPT-5.4 拉完了

GLM 4.7

  • 思考 3 秒
  • 输出 tokens:4.9 k
  • 总耗时:2m 30s
  • 生成速度:32.6T/s(不知道为什么这么慢,理论上 4.7 平时很快的)

image1502×828 72.7 KB

评价:基本上没思考,直接开始写,效果一般,问题很多。
打分:50 分


GLM 5

  • 思考 15 秒
  • 输出 tokens:5.4 k
  • 总耗时:1m 46s
  • 生成速度:50.9T/s

image1362×830 57.9 KB

评价:美观程度有所上升,但是存在遮挡。
打分:60 分


GLM-5-turbo

  • 思考 7 秒
  • 输出 tokens:5.9 k
  • 总耗时:1m 59s
  • 生成速度:49.3T/s

image1374×992 100 KB

评价:美观程度比 GLM 5 更好一些,并且元素也不遮挡了。
打分:80 分


GLM-5.1

  • 思考 634 秒
  • 输出 tokens:18.7 k
  • 总耗时:10m 50s
  • 生成速度:28.7T/s

image1720×1130 130 KB

评价:思考时间了足足 10 分钟,但是最后效果也是非常好的
打分:93 分


GPT-5.4

  • 思考 126 秒
  • 输出 tokens:15.3 k
  • 总耗时:3m 1s
  • 生成速度:84.6T/s

image1594×1018 156 KB

评价:不知道在干什么,思考了 2 分钟,还是一坨,拉完了
打分:40 分


Gemini 3.1 Pro

  • 思考 62 秒
  • 输出 tokens:18.3 k
  • 总耗时:1m 47s
  • 生成速度:170.4T/s

image1472×846 70.7 KB

评价:整体看起来还算舒服,不杂乱,但没有精致感
打分:85 分


Claude Opus 4.6

  • 思考 333 秒
  • 输出 tokens:27.8 k
  • 总耗时:6m 31s
  • 生成速度:71.0T/s

image1530×842 79.7 KB

评价:很美观,元素位置都很精准,看起来很舒服,但没有体现五点法
打分:95 分


Claude Sonnet 4.6

  • 思考 1263 秒
  • 输出 tokens:102.9 k
  • 总耗时:21m 30s
  • 生成速度:79.7T/s

image1844×820 63.1 KB

评价:画得倒没太大问题,但你这时间和 token 消耗,是认真的吗?
打分:92 分


总结:

模型 总耗时 输出 tokens 成本 分数 性价比 推荐星数
GLM-4.7 2m30s 4.9k $0.011 50 46.4 ★★☆☆☆
GLM-5 1m46s 5.4k $0.017 60 34.7 ★★★☆☆
GLM-5-Turbo 1m59s 5.9k $0.024 80 33.9 ★★★★☆
GLM-5.1 10m50s 18.7k $0.060 93 15.5 ★★★★★
GPT-5.4 3m01s 15.3k $0.23 40 1.74 ★☆☆☆☆
Gemini 3.1 Pro 1m47s 18.3k $0.22 85 3.87 ★★★☆☆
Claude Opus 4.6 6m31s 27.8k $0.70 95 1.37 ★★★★★
Claude Sonnet 4.6 21m30s 102.9k $1.5 92 0.60 ★★★☆☆
网友解答:
--【壹】--:

glm 5.1居然这么强? gpt画图能力确实一直是聊胜于无,但数理推导还是太扎实了以至于不得不用(仅凭这一点就足以在我的工作流中取代其他所有模型,包括 opus)


--【贰】--:

综合下来,gemini性价比最高,在短暂的时间内花费不多还能完成的不错


--【叁】--:

glm-5.1没想到这么强啊


--【肆】--:

gpt这画的什么垃圾


--【伍】--:

GPT任何涉及到多模态的地方都很垃圾,奥特曼不知道在干啥


--【陆】--:

哈哈哈
有原题吗


--【柒】--:

很离谱,我还以为是 5.4 能力倒退了,结果试了一下,5.2 和 5.3 更垃圾


--【捌】--:

原题比较乱,我就是随便写了一坨扔进去,让它用 Chatwise 的 Artifacts 来画

标签:人工智能