求助为什么我的Omxl半天出不来一句话
- 内容介绍
- 文章标签
- 相关推荐
求助一下为什么我这omxl部署本地模型那么慢,一直卡在37%那里, 设备是 macmini M4 24G, 模型 Qwen3.5-9B-unsloth-mlx,有没有大佬指点一下该怎么设置
image2564×1500 239 KB
image1772×1338 202 KB
--【壹】--:
了解了, 感谢, 我这实在太慢了, 简直没法用,放弃了
image2556×840 169 KB
--【贰】--:
哦,我这配置一般建议设置多少呢,设置到10240又没法给openclaw使用
image3040×1012 268 KB
--【叁】--:
自己电脑跑 claude code、openclow 这种长上下文都很吃力的
你可以去跑这个测试
image1920×1403 163 KB
然后看TTFT (ms) 指标 例如我这里就是
1024 上下文 prefill需要 1.58s
4096 上下文 prefill需要 5.81s
8192 上下文 prefill需要 14.2s
--【肆】--:
上下文大么,如果上下文太长的话 prefill 阶段会很慢
求助一下为什么我这omxl部署本地模型那么慢,一直卡在37%那里, 设备是 macmini M4 24G, 模型 Qwen3.5-9B-unsloth-mlx,有没有大佬指点一下该怎么设置
image2564×1500 239 KB
image1772×1338 202 KB
--【壹】--:
了解了, 感谢, 我这实在太慢了, 简直没法用,放弃了
image2556×840 169 KB
--【贰】--:
哦,我这配置一般建议设置多少呢,设置到10240又没法给openclaw使用
image3040×1012 268 KB
--【叁】--:
自己电脑跑 claude code、openclow 这种长上下文都很吃力的
你可以去跑这个测试
image1920×1403 163 KB
然后看TTFT (ms) 指标 例如我这里就是
1024 上下文 prefill需要 1.58s
4096 上下文 prefill需要 5.81s
8192 上下文 prefill需要 14.2s
--【肆】--:
上下文大么,如果上下文太长的话 prefill 阶段会很慢

