我做了一个桌面端应用,Pai,功能有点多,现已让她自己开发自己,详细情况,听我娓娓道来

2026-04-29 08:072阅读0评论SEO教程
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:

  • 我的帖子已经打上 开源推广 标签:
  • 我的开源项目完整开源,无未开源部分:
  • 我的开源项目已链接认可 LINUX DO 社区:
  • 我帖子内的项目介绍,AI生成、润色内容部分已截图发出:
  • 以上选择我承诺是永久有效的,接受社区和佬友监督:

以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出


PAI:从一个一边玩游戏一边快速唤出工作的自家用AI桌面小工具到功能全面的桌面AI枢纽

最初只是想做一个我一边玩游戏一边工作的时候,可以通过快捷键唤出的桌面小工具。
一个月的开发下来功能越来越强大,感觉已经到了可以分享的地步。

基础功能

1. 紧凑美观且完善的 Markdown 渲染

image1155×1380 54.5 KB

2. Skill、MCP、Todo、Plan、记忆、子代理、多供应商、自动压缩、上下文管理、图转文等基础功能应有尽有

image1132×964 40.2 KB

image906×664 26.4 KB

原生支持codex

image1155×1155 69.1 KB

3. 多会话切换,并且多会话支持并行执行任务

image892×338 11.9 KB

编程/办公与核心能力类功能

4. 多重降级、高性能稳定、高缓存命中率节省 token 的记忆 RAG

image1114×658 44 KB

并且不像其他应用那样会浪费大量的 token 和额外调用次数生成记忆。
记忆的管理、整合、降级、遗忘,全部都在上下文压缩和会话归档的一次调用中完成。

5. 任务

image1155×1155 58.1 KB

由 LLM 自己发起的长期任务,跟着任务追踪可以发放。

6. AI 可以主动截图,并且编写脚本执行鼠标键盘操作

image946×549 18 KB

不过经过实测,高分辨率下能稳定执行的大模型并不多。

7. 可撤回的编辑工具,完善的图转文缓存,可以直读 PDF,并且支持以图片方式读 PDF
能够胜任编程、终端执行、文书处理、Office、网络搜索等一系列常见任务。

8. 整个应用拥有一个专属于 AI 的最高权限的工作目录
AI 可以在里面自行设置 Skill、MCP、人格、部门,甚至可以自己管理临时图片、临时附件,自己在里面 clone 项目研究。
除了 AI 应用本身,其他的一切 AI 都可以自己来设置。
结合脚本工具,AI 甚至可以帮你完成本应用自身的设计。

9. 单会话可以设置多种工作目录,并且每个目录都可以单独设置权限

image906×378 17.5 KB

10. AI 可以自己压缩上下文
当然这个需要自己去提醒。

11. 灵活切换的向量数据结构
没错,你哪怕换向量模型也不会丢失记忆。其实我不知道为什么别的 RAG 都锁死模型。

12. 对话分支和对话投放
你可以选择一段会话,投放到新会话里面继续对话。
完之后或者你心情好了,你可以选择部分对话然后投放到其他对话里面。
还能自己筛选适合的内容开分支。

image1140×807 45.6 KB

13. AI 审查
你可以让 AI 帮你审查每一次的工具调用。

image479×1075 16.7 KB

14. 会话级 Review
除了每个工具的审查,还能一次性审查当前会话的所有改动。

清晰的审查报告一览
image476×1086 24.4 KB

多层级的审查方式
image1118×1072 48.7 KB

结构化的审查报告,你可以选择你认同的作为附件提交到发言中
image1155×1155 45.4 KB

15. 督工系统
你可以让系统帮你监督 AI 工作。

image879×738 29.8 KB

系统会持续监督 LLM 完成任务,不会让 LLM 的中途报告打断任务。

远程、协作与交互类功能

16. 一键唤出、语音唤出,甚至可以后台语音一键唤醒直接回答,甚至不需要额外设置就能实现

image1142×823 33.1 KB

你可以一边玩游戏一边看电视剧,一边让 AI 吐槽你看到的画面。

17. 远程联系人

image850×419 13.5 KB

暂时只支持这4个。

18. 人格 + 部门的提示词 + 权限控制

  • 人格负责绑定记忆
  • 部门负责工作流程 + 工具权限
  • 给部门安排人格实现精细化的控制

19. 表情包系统
是的,LLM 可以发表情。

image1118×407 26 KB

20. 联系人多种处理模式
支持有上下文的对话模式和无上下文的问答模式;关键字激活、始终激活和不激活模式。
在面对群聊的时候,持续观察,自行选择离场。
可以给远程联系人发送文件、图片。对,上面的表情包系统在远程联系人上也是支持的。

21. 快速指令
你可以快速预设一些常见的指令,立刻发送,不用每次都重复打。
只需要按一下 Tab 和回车。

image730×183 8.76 KB

22. 同一个会话里面,你可以让多个不同 AI(部门)同时说话

image1143×227 12.2 KB

也就是说,这不是一对一的会话,而是一个群聊。
并且每个 AI 都能分辨出不同 AI 和用户,不会导致上下文混乱。

23. AI 可以自己激活其他 AI
没错,结合上面的功能,你可以设置一个跑团主持人,然后让 AI 自己生成多个跑团玩家部门和人格,然后看着 AI 自己开始跑团。

24. 后台语音唤醒的同时附带当前画面

image977×439 17.9 KB

并且截图会自动管理,不会出现重复截图大量占用上下文的情况。

25. 简单好用的自定义主题色

相信你已经发现了,上面的主题配色截图花样百出,哪怕没有一个能满足你也没关系,你可以自己调。
image1155×1155 47.3 KB

性能与结语

26. 实现以上全部功能,甚至可能还有很多我没想起来的情况下,内存占用不到 100M

image1628×456 33.4 KB

这是一个 Rust 底层的 Agent,安装包只有 25M,单文件。

结语:
我已经使用pai自己迭代自己超过了一个月。
体验超过了我使用其他的开发软件。
并且试过连续工作十小时以上并最终完美完成任务。

多个朋友已经长期使用超过一个月,完成从法律分析,市场调查,小红书管理,游戏资料整理等一系列复杂任务。


链接

github.com

GitHub - kawayiYokami/P-ai: 可召唤、可委派、可执行的桌面 AI 工作中枢 / A summonable desktop AI…

可召唤、可委派、可执行的桌面 AI 工作中枢 / A summonable desktop AI command center that can plan, delegate, and execute

大概是可以自动更新的。
主要更新环境是 Windows,但是应该也支持 Linux 和 Mac。
linux支持由佬友joegodwanggod完成,但是不知道最新版本还是否能支持。
Mac 需要自己构建,因为没遇到想用的朋友。

因为用的人不多,可能 Bug 会有不少。如果你发现了 Bug,并且觉得好用想继续用下去可以发 Issue,不过我不一定理就是了。如果有能力可以发 PR,带上回归测试,有BUG没关系,只要你PR有想法,我会帮你修好。

没有文档和新手说明,如果需要文档才看得明白说明我UI做得不够好,我更愿意去改UI。

本应用由我个人独立完成。
参考过,并且觉得有价值的项目包括roo,codex,这2个都是非常优秀的项目。
参考过,并且觉得没有参考价值的项目包括…算了还是不说了。

主要就是一个分享。
如果你觉得好用,可以给我一个星。
哪怕你觉得不好用,但是觉得我很努力了,也可以给我一个星。

如果你愿意发视频写分享的话就更好了。

网友解答:
--【壹】--:

没看明白你的描述, codex就是走codex的登录方式,指的是gpt的codex套餐


--【贰】--:

image1154×298 48.9 KB


--【叁】--:

已经改好了,谢谢提醒。 我输入开源第一个是开源项目还以为是还同一个


--【肆】--:

功能很全,看上来是个很强大的助手介面,先STAR下载来试试。

请问是用codex让它一直自己改出来的吗?之前也想弄个类似的,然后就没了那回事。

问题描述:

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:

  • 我的帖子已经打上 开源推广 标签:
  • 我的开源项目完整开源,无未开源部分:
  • 我的开源项目已链接认可 LINUX DO 社区:
  • 我帖子内的项目介绍,AI生成、润色内容部分已截图发出:
  • 以上选择我承诺是永久有效的,接受社区和佬友监督:

以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出


PAI:从一个一边玩游戏一边快速唤出工作的自家用AI桌面小工具到功能全面的桌面AI枢纽

最初只是想做一个我一边玩游戏一边工作的时候,可以通过快捷键唤出的桌面小工具。
一个月的开发下来功能越来越强大,感觉已经到了可以分享的地步。

基础功能

1. 紧凑美观且完善的 Markdown 渲染

image1155×1380 54.5 KB

2. Skill、MCP、Todo、Plan、记忆、子代理、多供应商、自动压缩、上下文管理、图转文等基础功能应有尽有

image1132×964 40.2 KB

image906×664 26.4 KB

原生支持codex

image1155×1155 69.1 KB

3. 多会话切换,并且多会话支持并行执行任务

image892×338 11.9 KB

编程/办公与核心能力类功能

4. 多重降级、高性能稳定、高缓存命中率节省 token 的记忆 RAG

image1114×658 44 KB

并且不像其他应用那样会浪费大量的 token 和额外调用次数生成记忆。
记忆的管理、整合、降级、遗忘,全部都在上下文压缩和会话归档的一次调用中完成。

5. 任务

image1155×1155 58.1 KB

由 LLM 自己发起的长期任务,跟着任务追踪可以发放。

6. AI 可以主动截图,并且编写脚本执行鼠标键盘操作

image946×549 18 KB

不过经过实测,高分辨率下能稳定执行的大模型并不多。

7. 可撤回的编辑工具,完善的图转文缓存,可以直读 PDF,并且支持以图片方式读 PDF
能够胜任编程、终端执行、文书处理、Office、网络搜索等一系列常见任务。

8. 整个应用拥有一个专属于 AI 的最高权限的工作目录
AI 可以在里面自行设置 Skill、MCP、人格、部门,甚至可以自己管理临时图片、临时附件,自己在里面 clone 项目研究。
除了 AI 应用本身,其他的一切 AI 都可以自己来设置。
结合脚本工具,AI 甚至可以帮你完成本应用自身的设计。

9. 单会话可以设置多种工作目录,并且每个目录都可以单独设置权限

image906×378 17.5 KB

10. AI 可以自己压缩上下文
当然这个需要自己去提醒。

11. 灵活切换的向量数据结构
没错,你哪怕换向量模型也不会丢失记忆。其实我不知道为什么别的 RAG 都锁死模型。

12. 对话分支和对话投放
你可以选择一段会话,投放到新会话里面继续对话。
完之后或者你心情好了,你可以选择部分对话然后投放到其他对话里面。
还能自己筛选适合的内容开分支。

image1140×807 45.6 KB

13. AI 审查
你可以让 AI 帮你审查每一次的工具调用。

image479×1075 16.7 KB

14. 会话级 Review
除了每个工具的审查,还能一次性审查当前会话的所有改动。

清晰的审查报告一览
image476×1086 24.4 KB

多层级的审查方式
image1118×1072 48.7 KB

结构化的审查报告,你可以选择你认同的作为附件提交到发言中
image1155×1155 45.4 KB

15. 督工系统
你可以让系统帮你监督 AI 工作。

image879×738 29.8 KB

系统会持续监督 LLM 完成任务,不会让 LLM 的中途报告打断任务。

远程、协作与交互类功能

16. 一键唤出、语音唤出,甚至可以后台语音一键唤醒直接回答,甚至不需要额外设置就能实现

image1142×823 33.1 KB

你可以一边玩游戏一边看电视剧,一边让 AI 吐槽你看到的画面。

17. 远程联系人

image850×419 13.5 KB

暂时只支持这4个。

18. 人格 + 部门的提示词 + 权限控制

  • 人格负责绑定记忆
  • 部门负责工作流程 + 工具权限
  • 给部门安排人格实现精细化的控制

19. 表情包系统
是的,LLM 可以发表情。

image1118×407 26 KB

20. 联系人多种处理模式
支持有上下文的对话模式和无上下文的问答模式;关键字激活、始终激活和不激活模式。
在面对群聊的时候,持续观察,自行选择离场。
可以给远程联系人发送文件、图片。对,上面的表情包系统在远程联系人上也是支持的。

21. 快速指令
你可以快速预设一些常见的指令,立刻发送,不用每次都重复打。
只需要按一下 Tab 和回车。

image730×183 8.76 KB

22. 同一个会话里面,你可以让多个不同 AI(部门)同时说话

image1143×227 12.2 KB

也就是说,这不是一对一的会话,而是一个群聊。
并且每个 AI 都能分辨出不同 AI 和用户,不会导致上下文混乱。

23. AI 可以自己激活其他 AI
没错,结合上面的功能,你可以设置一个跑团主持人,然后让 AI 自己生成多个跑团玩家部门和人格,然后看着 AI 自己开始跑团。

24. 后台语音唤醒的同时附带当前画面

image977×439 17.9 KB

并且截图会自动管理,不会出现重复截图大量占用上下文的情况。

25. 简单好用的自定义主题色

相信你已经发现了,上面的主题配色截图花样百出,哪怕没有一个能满足你也没关系,你可以自己调。
image1155×1155 47.3 KB

性能与结语

26. 实现以上全部功能,甚至可能还有很多我没想起来的情况下,内存占用不到 100M

image1628×456 33.4 KB

这是一个 Rust 底层的 Agent,安装包只有 25M,单文件。

结语:
我已经使用pai自己迭代自己超过了一个月。
体验超过了我使用其他的开发软件。
并且试过连续工作十小时以上并最终完美完成任务。

多个朋友已经长期使用超过一个月,完成从法律分析,市场调查,小红书管理,游戏资料整理等一系列复杂任务。


链接

github.com

GitHub - kawayiYokami/P-ai: 可召唤、可委派、可执行的桌面 AI 工作中枢 / A summonable desktop AI…

可召唤、可委派、可执行的桌面 AI 工作中枢 / A summonable desktop AI command center that can plan, delegate, and execute

大概是可以自动更新的。
主要更新环境是 Windows,但是应该也支持 Linux 和 Mac。
linux支持由佬友joegodwanggod完成,但是不知道最新版本还是否能支持。
Mac 需要自己构建,因为没遇到想用的朋友。

因为用的人不多,可能 Bug 会有不少。如果你发现了 Bug,并且觉得好用想继续用下去可以发 Issue,不过我不一定理就是了。如果有能力可以发 PR,带上回归测试,有BUG没关系,只要你PR有想法,我会帮你修好。

没有文档和新手说明,如果需要文档才看得明白说明我UI做得不够好,我更愿意去改UI。

本应用由我个人独立完成。
参考过,并且觉得有价值的项目包括roo,codex,这2个都是非常优秀的项目。
参考过,并且觉得没有参考价值的项目包括…算了还是不说了。

主要就是一个分享。
如果你觉得好用,可以给我一个星。
哪怕你觉得不好用,但是觉得我很努力了,也可以给我一个星。

如果你愿意发视频写分享的话就更好了。

网友解答:
--【壹】--:

没看明白你的描述, codex就是走codex的登录方式,指的是gpt的codex套餐


--【贰】--:

image1154×298 48.9 KB


--【叁】--:

已经改好了,谢谢提醒。 我输入开源第一个是开源项目还以为是还同一个


--【肆】--:

功能很全,看上来是个很强大的助手介面,先STAR下载来试试。

请问是用codex让它一直自己改出来的吗?之前也想弄个类似的,然后就没了那回事。