modal.com一个月无限免费GLM5(fp8) 小测与基本教程()

2026-04-13 12:391阅读0评论SEO资源

内容介绍
文章标签
相关推荐

问题描述：

首先感谢这位佬提供的素材:

Modal 限免 GLM-5.1 — GLM-5.1 is available to try on Modal 开发调优

刚准备试一试 modal，看到了GLM-5.1限免到4月30号。响应忽快忽慢的，是不是应该等别人睡觉的时候跑。工具调用效果挺好的。注册登录过的佬可以到下面的地址领 Key。 https://modal.com/glm-5-endpoint [image] [image]

并发为1 只能聊天

Modal

Modal: High-performance AI infrastructure

Bring your own code, and run CPU, GPU, and data-intensive compute at scale. The serverless platform for AI and data teams.

点进去登录送5刀，不知道有什么用

然后去
https://modal.com/glm-5-endpoint?section=requests

手机端请横屏，不然的话没法创建key:
Screenshot_20260409_0139071260×1636 232 KB

不要curl 直接接入
下面那个延迟25秒的是在线curl
上面那个延迟才1秒的是接入chatbox
效果:
Screenshot_20260409_0142581260×1475 403 KB
Screenshot_20260409_0137061260×1305 236 KB

我这边可以检测到两个模型
fp8-2用不了，日志里显示503 不带2的可以用

对比gemma4 :
Screenshot_20260409_0148041260×1082 358 KB
glm5.1:
Screenshot_20260409_0148451260×1891 367 KB

网友解答：

--【壹】--：

image1080×1730 164 KB我裂开来，首字延时5838ms，输出速度8tokens每秒

--【贰】--：

就这速度能让很多人直接崩溃吧，尤其是弄agent的

--【叁】--：

已經被調到新註冊5美刀了麽，先前也試過註冊30美刀時用comfyui玩了一下

--【肆】--：

昨天的确还好，今天看来彻底炸了，大家太给力了

只是平均速度慢，但是他「能」回复的时候还是挺快的，就是会卡住卡很久。真正输出的时候一秒还是能输出十个字左右的。
Screenshot_20260410_0118251256×783 128 KB
Screenshot_20260410_0121001260×1768 499 KB
也是说了足足2分钟()

--【伍】--： 魔天Modem_w:

agent的

这就是个公益福利(当然也算是广告)。没有那么完美
无限免费还要求什么?

单并发就是一个局限
agent还好，就算调用工具也是先说完一段话，再调用工具返回结果了再说下一段话而不是同步进行(可能也有同步进行的agent)
所以单并发也不致命
但是慢就没话说了

--【陆】--：

请问这个模型是不能接入claude那些终端吗

--【柒】--：

这个点也好慢啊刚测试了一下链接用30秒

--【捌】--：

优化了标题
补充了部分内容

补充了两个参考对照模型~

--【玖】--：

佬写的真详细，赞啦。
以前我用modal跑comfyui的，现在有需要的时候在上面跑一些小的embedding模型。

--【拾】--：

没见过的格式，不会折腾，自己还是用minmax玩玩吧

--【拾壹】--：

是欣姐欸w
贴贴！w

欣欣|林可欣:

不知道有什么用

这个是可以用gpu的啦w

其实也是有别的用途的喵w）

--【拾贰】--：

就…就是可能还是有一点…需要一点抱抱啦w

~~其实ff都是拿这个来跑注册机的w)~~

欣姐把这个当成一个学Linux的地方就可以啦w

--【拾叁】--： 0wFF:

贴贴！w

感觉是ff酱第一次找我贴贴w
看起来状态还不错呢~

0wFF:

这个是可以用gpu的啦w

那挺好的w
不过我这种小白用不好

--【拾肆】--：

那些配置似乎比较复杂，这种需要适合简单配置的平台

标签：人工智能纯水 GLM

问题描述：

首先感谢这位佬提供的素材:

Modal 限免 GLM-5.1 — GLM-5.1 is available to try on Modal 开发调优

刚准备试一试 modal，看到了GLM-5.1限免到4月30号。响应忽快忽慢的，是不是应该等别人睡觉的时候跑。工具调用效果挺好的。注册登录过的佬可以到下面的地址领 Key。 https://modal.com/glm-5-endpoint [image] [image]

并发为1 只能聊天

Modal

Modal: High-performance AI infrastructure

Bring your own code, and run CPU, GPU, and data-intensive compute at scale. The serverless platform for AI and data teams.

点进去登录送5刀，不知道有什么用

然后去
https://modal.com/glm-5-endpoint?section=requests

手机端请横屏，不然的话没法创建key:
Screenshot_20260409_0139071260×1636 232 KB

我这边可以检测到两个模型
fp8-2用不了，日志里显示503 不带2的可以用

对比gemma4 :
Screenshot_20260409_0148041260×1082 358 KB
glm5.1:
Screenshot_20260409_0148451260×1891 367 KB

网友解答：

--【壹】--：

image1080×1730 164 KB我裂开来，首字延时5838ms，输出速度8tokens每秒

--【贰】--：

就这速度能让很多人直接崩溃吧，尤其是弄agent的

--【叁】--：

已經被調到新註冊5美刀了麽，先前也試過註冊30美刀時用comfyui玩了一下

--【肆】--：

昨天的确还好，今天看来彻底炸了，大家太给力了

--【伍】--： 魔天Modem_w:

agent的

这就是个公益福利(当然也算是广告)。没有那么完美
无限免费还要求什么?

--【陆】--：

请问这个模型是不能接入claude那些终端吗

--【柒】--：

这个点也好慢啊刚测试了一下链接用30秒

--【捌】--：

优化了标题
补充了部分内容

补充了两个参考对照模型~

--【玖】--：

佬写的真详细，赞啦。
以前我用modal跑comfyui的，现在有需要的时候在上面跑一些小的embedding模型。

--【拾】--：

没见过的格式，不会折腾，自己还是用minmax玩玩吧

--【拾壹】--：

是欣姐欸w
贴贴！w

欣欣|林可欣:

不知道有什么用

这个是可以用gpu的啦w

其实也是有别的用途的喵w）

--【拾贰】--：

就…就是可能还是有一点…需要一点抱抱啦w

~~其实ff都是拿这个来跑注册机的w)~~

欣姐把这个当成一个学Linux的地方就可以啦w

--【拾叁】--： 0wFF:

贴贴！w

感觉是ff酱第一次找我贴贴w
看起来状态还不错呢~

0wFF:

这个是可以用gpu的啦w

那挺好的w
不过我这种小白用不好

--【拾肆】--：

那些配置似乎比较复杂，这种需要适合简单配置的平台

标签：人工智能纯水 GLM

Modal: High-performance AI infrastructure

相关推荐

Modal: High-performance AI infrastructure

相关推荐