【首发开源 】安卓 AI agent(vlm+cli)最强形态
- 内容介绍
- 文章标签
- 相关推荐
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
- 我的帖子已经打上 开源推广 标签: 是
- 我的开源项目完整开源,无未开源部分: 是
- 我的开源项目已链接认可 LINUX DO 社区: 是
- 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
- 以上选择我承诺是永久有效的,接受社区和佬友监督: 是
以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
先来一小段碎碎念
Ok,已经很晚了,没想到会这么晚才发这个帖子。
熟悉我的佬友(?估计没有哈哈哈,虽然我三级了但是不是很活跃)估计会发现我最近不是很活跃发帖子,那我去干嘛了呢?没错我被一个学长拉去公司实习了。
我们最早做的是 豆包手机 那种形态的手机助手,由于我们团队一直分为两大部分,我们这边基本都是学生,我们不负责盈利的业务。然后我们有些 feature 也不太可能备案,一直就没发布投入使用。最近,终于是准备把我们做的这部分全部开源了~
一句话说清楚我们做的是什么:
豆包手机+OpenClaw
我们的核心能力是使用 VLM 完成 Android 自动化任务,最近我受到了 Minis 这个项目的启发,给 Android agent 添加了终端能力(termux+Ubuntu),这里一并感谢社区的开发者。
所以就出现了 兼具 VLM 工具和 cli 工具的手机 AI agent!
Agent基本工具:
- VLM task
- 定时任务/闹钟
- Memory(Mem0)
- Cli(Ubuntu)
- browser use
- file system
- skills
- ……
- MCP / Mcp Server(这意味着你可以把手机给龙虾玩!)
直接上图:
abd75b6c90c6127f9e45ebe9cbcd30f71080×4191 355 KB
e3c9b0fed1ced947f761c9406839c5151080×6407 702 KB
5fa7e9058377351266932b1ed3a99ea01080×2376 123 KB
5948f934fc8cafcf1cb9a07ad5438dba1080×2376 164 KB
e46c76bbba16673d107cc290b60f161e1080×2376 143 KB
f264a2acf04e9283afd82b8d8be6346d1080×2376 118 KB
image752×1670 90.3 KB
我们相信这套 CLI+VLM 的 Agent 系统必定会大有作为,拓展性也会非常强,可玩性很高。所以我们决定开源,大家一起来建设这个大有可为的 Android world!
我们的 TODO:
直接集成 termux app 到软件内;
更丰富的 agent 工具!
求求 star!
GitHub - omnimind-ai/OpenOmniBot: This is community version of OmniMind Xiaowan app...
This is community version of OmniMind Xiaowan app || 或者你也可以叫她 OOB!她可以操作终端,也可以完成 Android 世界的广泛任务
开源前期 bug 多多(因为我们直接从商业版连续删几万行代码才搞出开源版的),希望佬友多多包涵以及不要忘记了 PR 活动!
网友解答:--【壹】--:
前排支持
--【贰】--:
前排支持哇
--【叁】--:
强呀, 大佬
--【肆】--:
前排支持
--【伍】--:
前排支持
--【陆】--:
太牛了佬,真真仰望
--【柒】--:
前排支持
--【捌】--:
时间仓促,我正在测试 cicd 流程,估计马上可以发包了……
--【玖】--:
支持一下佬!
--【拾】--: advent:
MCP / Mcp Server(这意味着你可以把手机给龙虾玩!)
没看懂,是APP提供mcp服务给龙虾使用?
持续关注!
--【拾壹】--:
厉害了,佬!
--【拾贰】--:
协同进化了()
主要是这样有ageny接管的视觉效果
--【拾叁】--:
有点儿疑惑,为什么自动化Agent设计的都是Agent控制时屏幕四周一圈光晕,看到的几个项目都是这样
--【拾肆】--:
支持支持
--【拾伍】--:
豆包手机之前被各大厂围攻,可惜
--【拾陆】--:
我们用的无障碍权限,不太可能会被制裁
--【拾柒】--:
是的。也可以给这个软件再接入mcp工具
--【拾捌】--:
强啊,支持
--【拾玖】--:
支持
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
- 我的帖子已经打上 开源推广 标签: 是
- 我的开源项目完整开源,无未开源部分: 是
- 我的开源项目已链接认可 LINUX DO 社区: 是
- 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
- 以上选择我承诺是永久有效的,接受社区和佬友监督: 是
以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
先来一小段碎碎念
Ok,已经很晚了,没想到会这么晚才发这个帖子。
熟悉我的佬友(?估计没有哈哈哈,虽然我三级了但是不是很活跃)估计会发现我最近不是很活跃发帖子,那我去干嘛了呢?没错我被一个学长拉去公司实习了。
我们最早做的是 豆包手机 那种形态的手机助手,由于我们团队一直分为两大部分,我们这边基本都是学生,我们不负责盈利的业务。然后我们有些 feature 也不太可能备案,一直就没发布投入使用。最近,终于是准备把我们做的这部分全部开源了~
一句话说清楚我们做的是什么:
豆包手机+OpenClaw
我们的核心能力是使用 VLM 完成 Android 自动化任务,最近我受到了 Minis 这个项目的启发,给 Android agent 添加了终端能力(termux+Ubuntu),这里一并感谢社区的开发者。
所以就出现了 兼具 VLM 工具和 cli 工具的手机 AI agent!
Agent基本工具:
- VLM task
- 定时任务/闹钟
- Memory(Mem0)
- Cli(Ubuntu)
- browser use
- file system
- skills
- ……
- MCP / Mcp Server(这意味着你可以把手机给龙虾玩!)
直接上图:
abd75b6c90c6127f9e45ebe9cbcd30f71080×4191 355 KB
e3c9b0fed1ced947f761c9406839c5151080×6407 702 KB
5fa7e9058377351266932b1ed3a99ea01080×2376 123 KB
5948f934fc8cafcf1cb9a07ad5438dba1080×2376 164 KB
e46c76bbba16673d107cc290b60f161e1080×2376 143 KB
f264a2acf04e9283afd82b8d8be6346d1080×2376 118 KB
image752×1670 90.3 KB
我们相信这套 CLI+VLM 的 Agent 系统必定会大有作为,拓展性也会非常强,可玩性很高。所以我们决定开源,大家一起来建设这个大有可为的 Android world!
我们的 TODO:
直接集成 termux app 到软件内;
更丰富的 agent 工具!
求求 star!
GitHub - omnimind-ai/OpenOmniBot: This is community version of OmniMind Xiaowan app...
This is community version of OmniMind Xiaowan app || 或者你也可以叫她 OOB!她可以操作终端,也可以完成 Android 世界的广泛任务
开源前期 bug 多多(因为我们直接从商业版连续删几万行代码才搞出开源版的),希望佬友多多包涵以及不要忘记了 PR 活动!
网友解答:--【壹】--:
前排支持
--【贰】--:
前排支持哇
--【叁】--:
强呀, 大佬
--【肆】--:
前排支持
--【伍】--:
前排支持
--【陆】--:
太牛了佬,真真仰望
--【柒】--:
前排支持
--【捌】--:
时间仓促,我正在测试 cicd 流程,估计马上可以发包了……
--【玖】--:
支持一下佬!
--【拾】--: advent:
MCP / Mcp Server(这意味着你可以把手机给龙虾玩!)
没看懂,是APP提供mcp服务给龙虾使用?
持续关注!
--【拾壹】--:
厉害了,佬!
--【拾贰】--:
协同进化了()
主要是这样有ageny接管的视觉效果
--【拾叁】--:
有点儿疑惑,为什么自动化Agent设计的都是Agent控制时屏幕四周一圈光晕,看到的几个项目都是这样
--【拾肆】--:
支持支持
--【拾伍】--:
豆包手机之前被各大厂围攻,可惜
--【拾陆】--:
我们用的无障碍权限,不太可能会被制裁
--【拾柒】--:
是的。也可以给这个软件再接入mcp工具
--【拾捌】--:
强啊,支持
--【拾玖】--:
支持

