求助为什么我的Omxl半天出不来一句话

2026-04-11 10:450阅读0评论SEO资源
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

求助一下为什么我这omxl部署本地模型那么慢,一直卡在37%那里, 设备是 macmini M4 24G, 模型 Qwen3.5-9B-unsloth-mlx,有没有大佬指点一下该怎么设置

image2564×1500 239 KB
image1772×1338 202 KB

网友解答:
--【壹】--:

了解了, 感谢, 我这实在太慢了, 简直没法用,放弃了
image2556×840 169 KB


--【贰】--:

哦,我这配置一般建议设置多少呢,设置到10240又没法给openclaw使用
image3040×1012 268 KB


--【叁】--:

自己电脑跑 claude code、openclow 这种长上下文都很吃力的

你可以去跑这个测试

image1920×1403 163 KB

然后看TTFT (ms) 指标 例如我这里就是

1024 上下文 prefill需要 1.58s
4096 上下文 prefill需要 5.81s
8192 上下文 prefill需要 14.2s


--【肆】--:

上下文大么,如果上下文太长的话 prefill 阶段会很慢

标签:快问快答
问题描述:

求助一下为什么我这omxl部署本地模型那么慢,一直卡在37%那里, 设备是 macmini M4 24G, 模型 Qwen3.5-9B-unsloth-mlx,有没有大佬指点一下该怎么设置

image2564×1500 239 KB
image1772×1338 202 KB

网友解答:
--【壹】--:

了解了, 感谢, 我这实在太慢了, 简直没法用,放弃了
image2556×840 169 KB


--【贰】--:

哦,我这配置一般建议设置多少呢,设置到10240又没法给openclaw使用
image3040×1012 268 KB


--【叁】--:

自己电脑跑 claude code、openclow 这种长上下文都很吃力的

你可以去跑这个测试

image1920×1403 163 KB

然后看TTFT (ms) 指标 例如我这里就是

1024 上下文 prefill需要 1.58s
4096 上下文 prefill需要 5.81s
8192 上下文 prefill需要 14.2s


--【肆】--:

上下文大么,如果上下文太长的话 prefill 阶段会很慢

标签:快问快答