我做了一个桌面端应用,Pai,功能有点多,现已让她自己开发自己,详细情况,听我娓娓道来
- 内容介绍
- 文章标签
- 相关推荐
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
- 我的帖子已经打上 开源推广 标签: 是
- 我的开源项目完整开源,无未开源部分: 是
- 我的开源项目已链接认可 LINUX DO 社区: 是
- 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
- 以上选择我承诺是永久有效的,接受社区和佬友监督: 是
以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
PAI:从一个一边玩游戏一边快速唤出工作的自家用AI桌面小工具到功能全面的桌面AI枢纽
最初只是想做一个我一边玩游戏一边工作的时候,可以通过快捷键唤出的桌面小工具。
一个月的开发下来功能越来越强大,感觉已经到了可以分享的地步。
基础功能
1. 紧凑美观且完善的 Markdown 渲染
image1155×1380 54.5 KB
2. Skill、MCP、Todo、Plan、记忆、子代理、多供应商、自动压缩、上下文管理、图转文等基础功能应有尽有
image1132×964 40.2 KB
image906×664 26.4 KB
原生支持codex
image1155×1155 69.1 KB
3. 多会话切换,并且多会话支持并行执行任务
image892×338 11.9 KB
编程/办公与核心能力类功能
4. 多重降级、高性能稳定、高缓存命中率节省 token 的记忆 RAG
image1114×658 44 KB
并且不像其他应用那样会浪费大量的 token 和额外调用次数生成记忆。
记忆的管理、整合、降级、遗忘,全部都在上下文压缩和会话归档的一次调用中完成。
5. 任务
image1155×1155 58.1 KB
由 LLM 自己发起的长期任务,跟着任务追踪可以发放。
6. AI 可以主动截图,并且编写脚本执行鼠标键盘操作
image946×549 18 KB
不过经过实测,高分辨率下能稳定执行的大模型并不多。
7. 可撤回的编辑工具,完善的图转文缓存,可以直读 PDF,并且支持以图片方式读 PDF
能够胜任编程、终端执行、文书处理、Office、网络搜索等一系列常见任务。
8. 整个应用拥有一个专属于 AI 的最高权限的工作目录
AI 可以在里面自行设置 Skill、MCP、人格、部门,甚至可以自己管理临时图片、临时附件,自己在里面 clone 项目研究。
除了 AI 应用本身,其他的一切 AI 都可以自己来设置。
结合脚本工具,AI 甚至可以帮你完成本应用自身的设计。
9. 单会话可以设置多种工作目录,并且每个目录都可以单独设置权限
image906×378 17.5 KB
10. AI 可以自己压缩上下文
当然这个需要自己去提醒。
11. 灵活切换的向量数据结构
没错,你哪怕换向量模型也不会丢失记忆。其实我不知道为什么别的 RAG 都锁死模型。
12. 对话分支和对话投放
你可以选择一段会话,投放到新会话里面继续对话。
完之后或者你心情好了,你可以选择部分对话然后投放到其他对话里面。
还能自己筛选适合的内容开分支。
image1140×807 45.6 KB
13. AI 审查
你可以让 AI 帮你审查每一次的工具调用。
image479×1075 16.7 KB
14. 会话级 Review
除了每个工具的审查,还能一次性审查当前会话的所有改动。
清晰的审查报告一览
image476×1086 24.4 KB
多层级的审查方式
image1118×1072 48.7 KB
结构化的审查报告,你可以选择你认同的作为附件提交到发言中
image1155×1155 45.4 KB
15. 督工系统
你可以让系统帮你监督 AI 工作。
image879×738 29.8 KB
系统会持续监督 LLM 完成任务,不会让 LLM 的中途报告打断任务。
远程、协作与交互类功能
16. 一键唤出、语音唤出,甚至可以后台语音一键唤醒直接回答,甚至不需要额外设置就能实现
image1142×823 33.1 KB
你可以一边玩游戏一边看电视剧,一边让 AI 吐槽你看到的画面。
17. 远程联系人
image850×419 13.5 KB
暂时只支持这4个。
18. 人格 + 部门的提示词 + 权限控制
- 人格负责绑定记忆
- 部门负责工作流程 + 工具权限
- 给部门安排人格实现精细化的控制
19. 表情包系统
是的,LLM 可以发表情。
image1118×407 26 KB
20. 联系人多种处理模式
支持有上下文的对话模式和无上下文的问答模式;关键字激活、始终激活和不激活模式。
在面对群聊的时候,持续观察,自行选择离场。
可以给远程联系人发送文件、图片。对,上面的表情包系统在远程联系人上也是支持的。
21. 快速指令
你可以快速预设一些常见的指令,立刻发送,不用每次都重复打。
只需要按一下 Tab 和回车。
image730×183 8.76 KB
22. 同一个会话里面,你可以让多个不同 AI(部门)同时说话
image1143×227 12.2 KB
也就是说,这不是一对一的会话,而是一个群聊。
并且每个 AI 都能分辨出不同 AI 和用户,不会导致上下文混乱。
23. AI 可以自己激活其他 AI
没错,结合上面的功能,你可以设置一个跑团主持人,然后让 AI 自己生成多个跑团玩家部门和人格,然后看着 AI 自己开始跑团。
24. 后台语音唤醒的同时附带当前画面
image977×439 17.9 KB
并且截图会自动管理,不会出现重复截图大量占用上下文的情况。
25. 简单好用的自定义主题色
相信你已经发现了,上面的主题配色截图花样百出,哪怕没有一个能满足你也没关系,你可以自己调。
image1155×1155 47.3 KB
性能与结语
26. 实现以上全部功能,甚至可能还有很多我没想起来的情况下,内存占用不到 100M
image1628×456 33.4 KB
这是一个 Rust 底层的 Agent,安装包只有 25M,单文件。
结语:
我已经使用pai自己迭代自己超过了一个月。
体验超过了我使用其他的开发软件。
并且试过连续工作十小时以上并最终完美完成任务。
多个朋友已经长期使用超过一个月,完成从法律分析,市场调查,小红书管理,游戏资料整理等一系列复杂任务。
链接
github.com
GitHub - kawayiYokami/P-ai: 可召唤、可委派、可执行的桌面 AI 工作中枢 / A summonable desktop AI…
可召唤、可委派、可执行的桌面 AI 工作中枢 / A summonable desktop AI command center that can plan, delegate, and execute
大概是可以自动更新的。
主要更新环境是 Windows,但是应该也支持 Linux 和 Mac。
linux支持由佬友joegodwanggod完成,但是不知道最新版本还是否能支持。
Mac 需要自己构建,因为没遇到想用的朋友。
因为用的人不多,可能 Bug 会有不少。如果你发现了 Bug,并且觉得好用想继续用下去可以发 Issue,不过我不一定理就是了。如果有能力可以发 PR,带上回归测试,有BUG没关系,只要你PR有想法,我会帮你修好。
没有文档和新手说明,如果需要文档才看得明白说明我UI做得不够好,我更愿意去改UI。
本应用由我个人独立完成。
参考过,并且觉得有价值的项目包括roo,codex,这2个都是非常优秀的项目。
参考过,并且觉得没有参考价值的项目包括…算了还是不说了。
主要就是一个分享。
如果你觉得好用,可以给我一个星。
哪怕你觉得不好用,但是觉得我很努力了,也可以给我一个星。
如果你愿意发视频写分享的话就更好了。
网友解答:--【壹】--:
没看明白你的描述, codex就是走codex的登录方式,指的是gpt的codex套餐
--【贰】--:
image1154×298 48.9 KB
--【叁】--:
已经改好了,谢谢提醒。 我输入开源第一个是开源项目还以为是还同一个
--【肆】--:
功能很全,看上来是个很强大的助手介面,先STAR下载来试试。
请问是用codex让它一直自己改出来的吗?之前也想弄个类似的,然后就没了那回事。
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
- 我的帖子已经打上 开源推广 标签: 是
- 我的开源项目完整开源,无未开源部分: 是
- 我的开源项目已链接认可 LINUX DO 社区: 是
- 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
- 以上选择我承诺是永久有效的,接受社区和佬友监督: 是
以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
PAI:从一个一边玩游戏一边快速唤出工作的自家用AI桌面小工具到功能全面的桌面AI枢纽
最初只是想做一个我一边玩游戏一边工作的时候,可以通过快捷键唤出的桌面小工具。
一个月的开发下来功能越来越强大,感觉已经到了可以分享的地步。
基础功能
1. 紧凑美观且完善的 Markdown 渲染
image1155×1380 54.5 KB
2. Skill、MCP、Todo、Plan、记忆、子代理、多供应商、自动压缩、上下文管理、图转文等基础功能应有尽有
image1132×964 40.2 KB
image906×664 26.4 KB
原生支持codex
image1155×1155 69.1 KB
3. 多会话切换,并且多会话支持并行执行任务
image892×338 11.9 KB
编程/办公与核心能力类功能
4. 多重降级、高性能稳定、高缓存命中率节省 token 的记忆 RAG
image1114×658 44 KB
并且不像其他应用那样会浪费大量的 token 和额外调用次数生成记忆。
记忆的管理、整合、降级、遗忘,全部都在上下文压缩和会话归档的一次调用中完成。
5. 任务
image1155×1155 58.1 KB
由 LLM 自己发起的长期任务,跟着任务追踪可以发放。
6. AI 可以主动截图,并且编写脚本执行鼠标键盘操作
image946×549 18 KB
不过经过实测,高分辨率下能稳定执行的大模型并不多。
7. 可撤回的编辑工具,完善的图转文缓存,可以直读 PDF,并且支持以图片方式读 PDF
能够胜任编程、终端执行、文书处理、Office、网络搜索等一系列常见任务。
8. 整个应用拥有一个专属于 AI 的最高权限的工作目录
AI 可以在里面自行设置 Skill、MCP、人格、部门,甚至可以自己管理临时图片、临时附件,自己在里面 clone 项目研究。
除了 AI 应用本身,其他的一切 AI 都可以自己来设置。
结合脚本工具,AI 甚至可以帮你完成本应用自身的设计。
9. 单会话可以设置多种工作目录,并且每个目录都可以单独设置权限
image906×378 17.5 KB
10. AI 可以自己压缩上下文
当然这个需要自己去提醒。
11. 灵活切换的向量数据结构
没错,你哪怕换向量模型也不会丢失记忆。其实我不知道为什么别的 RAG 都锁死模型。
12. 对话分支和对话投放
你可以选择一段会话,投放到新会话里面继续对话。
完之后或者你心情好了,你可以选择部分对话然后投放到其他对话里面。
还能自己筛选适合的内容开分支。
image1140×807 45.6 KB
13. AI 审查
你可以让 AI 帮你审查每一次的工具调用。
image479×1075 16.7 KB
14. 会话级 Review
除了每个工具的审查,还能一次性审查当前会话的所有改动。
清晰的审查报告一览
image476×1086 24.4 KB
多层级的审查方式
image1118×1072 48.7 KB
结构化的审查报告,你可以选择你认同的作为附件提交到发言中
image1155×1155 45.4 KB
15. 督工系统
你可以让系统帮你监督 AI 工作。
image879×738 29.8 KB
系统会持续监督 LLM 完成任务,不会让 LLM 的中途报告打断任务。
远程、协作与交互类功能
16. 一键唤出、语音唤出,甚至可以后台语音一键唤醒直接回答,甚至不需要额外设置就能实现
image1142×823 33.1 KB
你可以一边玩游戏一边看电视剧,一边让 AI 吐槽你看到的画面。
17. 远程联系人
image850×419 13.5 KB
暂时只支持这4个。
18. 人格 + 部门的提示词 + 权限控制
- 人格负责绑定记忆
- 部门负责工作流程 + 工具权限
- 给部门安排人格实现精细化的控制
19. 表情包系统
是的,LLM 可以发表情。
image1118×407 26 KB
20. 联系人多种处理模式
支持有上下文的对话模式和无上下文的问答模式;关键字激活、始终激活和不激活模式。
在面对群聊的时候,持续观察,自行选择离场。
可以给远程联系人发送文件、图片。对,上面的表情包系统在远程联系人上也是支持的。
21. 快速指令
你可以快速预设一些常见的指令,立刻发送,不用每次都重复打。
只需要按一下 Tab 和回车。
image730×183 8.76 KB
22. 同一个会话里面,你可以让多个不同 AI(部门)同时说话
image1143×227 12.2 KB
也就是说,这不是一对一的会话,而是一个群聊。
并且每个 AI 都能分辨出不同 AI 和用户,不会导致上下文混乱。
23. AI 可以自己激活其他 AI
没错,结合上面的功能,你可以设置一个跑团主持人,然后让 AI 自己生成多个跑团玩家部门和人格,然后看着 AI 自己开始跑团。
24. 后台语音唤醒的同时附带当前画面
image977×439 17.9 KB
并且截图会自动管理,不会出现重复截图大量占用上下文的情况。
25. 简单好用的自定义主题色
相信你已经发现了,上面的主题配色截图花样百出,哪怕没有一个能满足你也没关系,你可以自己调。
image1155×1155 47.3 KB
性能与结语
26. 实现以上全部功能,甚至可能还有很多我没想起来的情况下,内存占用不到 100M
image1628×456 33.4 KB
这是一个 Rust 底层的 Agent,安装包只有 25M,单文件。
结语:
我已经使用pai自己迭代自己超过了一个月。
体验超过了我使用其他的开发软件。
并且试过连续工作十小时以上并最终完美完成任务。
多个朋友已经长期使用超过一个月,完成从法律分析,市场调查,小红书管理,游戏资料整理等一系列复杂任务。
链接
github.com
GitHub - kawayiYokami/P-ai: 可召唤、可委派、可执行的桌面 AI 工作中枢 / A summonable desktop AI…
可召唤、可委派、可执行的桌面 AI 工作中枢 / A summonable desktop AI command center that can plan, delegate, and execute
大概是可以自动更新的。
主要更新环境是 Windows,但是应该也支持 Linux 和 Mac。
linux支持由佬友joegodwanggod完成,但是不知道最新版本还是否能支持。
Mac 需要自己构建,因为没遇到想用的朋友。
因为用的人不多,可能 Bug 会有不少。如果你发现了 Bug,并且觉得好用想继续用下去可以发 Issue,不过我不一定理就是了。如果有能力可以发 PR,带上回归测试,有BUG没关系,只要你PR有想法,我会帮你修好。
没有文档和新手说明,如果需要文档才看得明白说明我UI做得不够好,我更愿意去改UI。
本应用由我个人独立完成。
参考过,并且觉得有价值的项目包括roo,codex,这2个都是非常优秀的项目。
参考过,并且觉得没有参考价值的项目包括…算了还是不说了。
主要就是一个分享。
如果你觉得好用,可以给我一个星。
哪怕你觉得不好用,但是觉得我很努力了,也可以给我一个星。
如果你愿意发视频写分享的话就更好了。
网友解答:--【壹】--:
没看明白你的描述, codex就是走codex的登录方式,指的是gpt的codex套餐
--【贰】--:
image1154×298 48.9 KB
--【叁】--:
已经改好了,谢谢提醒。 我输入开源第一个是开源项目还以为是还同一个
--【肆】--:
功能很全,看上来是个很强大的助手介面,先STAR下载来试试。
请问是用codex让它一直自己改出来的吗?之前也想弄个类似的,然后就没了那回事。

