Intel Arc Alchemist架构(A770A750)运行Qwen 3.5并支持多模态

2026-04-13 12:210阅读0评论SEO资讯
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:

  • 我的帖子已经打上 开源推广 标签:
  • 我的开源项目完整开源,无未开源部分:
  • 我的开源项目已链接认可 LINUX DO 社区:
  • 我帖子内的项目介绍,AI生成、润色内容部分已截图发出:
  • 以上选择我承诺是永久有效的,接受社区和佬友监督:

以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出


继续昨天的帖子
https://linux.do/t/topic/1829505

先放实测。

支持思维链输出,添加参数 “–reasoning-format deepseek” 即参考deepseek思维链格式添加完整包裹。

项目添加了自动计算机制,不需要显式指定上下文,在触及显存OOM之前输出最大长度。

载入内存时将权重量化到int4再丢入GPU,提升效率。

支持Qwen3.5的多模态。

阅读全文
问题描述:

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:

  • 我的帖子已经打上 开源推广 标签:
  • 我的开源项目完整开源,无未开源部分:
  • 我的开源项目已链接认可 LINUX DO 社区:
  • 我帖子内的项目介绍,AI生成、润色内容部分已截图发出:
  • 以上选择我承诺是永久有效的,接受社区和佬友监督:

以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出


继续昨天的帖子
https://linux.do/t/topic/1829505

先放实测。

支持思维链输出,添加参数 “–reasoning-format deepseek” 即参考deepseek思维链格式添加完整包裹。

项目添加了自动计算机制,不需要显式指定上下文,在触及显存OOM之前输出最大长度。

载入内存时将权重量化到int4再丢入GPU,提升效率。

支持Qwen3.5的多模态。

阅读全文