手机 agent 需要哪些功能?
- 内容介绍
- 文章标签
- 相关推荐
往期帖子发了几个开源推广贴,感觉大家都不怎么感兴趣。估计是我们的软件没有解决各位佬日常手机使用的痛点!
所以想问问,和大家讨论一下手机上的agent实现哪些事情是有意义的?
我个人觉得,写代码应该是没意义的。签到薅羊毛是有意义的…
网友解答:--【壹】--:
咳,我记得去年或前年一些朋友搞创业就是做的这个方向,后来黄了,但除了卖给手机厂以外,我一直不太懂这个场景创业的长期 vision 是什么(
我曾经考虑,这样的产品可以作为 AI 陪伴的一部分 (因为我当时在搞 AI 陪伴,Open-LLM-VTuber咩),因为我一直认为,像是 AI 陪伴这样的 “入口”,在获取了长期记忆积累之后,做任何任务,都能携带这长期记忆,来比任何独立的应用,更能帮助到用户。但说真的有些牵强(),不能支撑手机 agent 本身作为独立的业务创业。
其实我觉得浏览器 agent 也有一点点这样的问题。这种 UI agent,本质上依赖一个假设: 用户花时间在浏览器/手机上,是为了解决一些问题。如果有人能帮他们做这些事,他们宁愿不用手机。但很多时候,人用浏览器,用手机,并不是… 痛苦的。这使得浏览器 agent 只能在少数几种机械化任务上发挥作用,而且很多集中在白嫖上。当然,浏览器 + AI 本身非常有用,但浏览器 agent 的有用性,在我看来没有那么强。手机 UI agent 在我看来也是这样。我们有哪些任务是必须在手机上做,是偏机械化的,可以被 AI 代替的呢?现阶段,在我看来是比较少的。
可能一个重要的 use case,在我看来,是作为自动化测试的一部分,打通 AI coding agent 的开发和测试闭环,让 AI coding agent 写完东西,可以自己上手摸产品,然后再改进。不过我不了解移动端开发,所以不太确定这种场景需不需要 UI agent,说不定其实一个 adb 或是现有的测试框架就解决了问题。
另一个可能的 use case,或者说一个可能的长期 vision,可以说,让 AI agent 完全替代你去工作。一个能操作你手机的 AI,能更全面的帮你解决更多问题,比如帮你回消息或买东西之类的…? 但我觉得更理想的形式,还是在电脑上或者云端。另外,这需要一个长期记忆,这需要一个更有用,更全面的 agent,毕竟你的工作和生活也不全发生在手机内。
随便啦,我想听听别人的想法。我上面提到的所有观点都完全不坚定且欢迎反驳。
--【贰】--:
手机计算能力带不动足够好的模型吧,但是个人信息用上云端模型也有点隐私泄露的威胁…
端侧云侧各有各的问题
--【叁】--: advent:
这么看来,实际上手机上的 agent 最好不要跑在手机本地?
那还能叫手机 agent 吗 不过我确实就是也是这么想的(
我觉得我理想中的 agent,核心可能是在云端的,它可能有触手,可以操作你的设备,你的手机,但也有自己的空间去做工作。它自己有空间,所以他干活时,你还是可以用自己的设备。真的干长时间的正经活,如果他占用了你的手机,那你用什么?当然也有手机上到底什么活需要 AI 来做的问题 (肯定还是有,但… 有哪些是硬需求,硬到让用户愿意下载一个 UI agent,是值得讨论的)。
手机 agent 的核心优势确实就是 context,而不是作为执行任务的地方 (此为暴论)。
可能不见得是主要做工作的地方,而是获取上下文,做针对用户的 deep research 的地方。而在云端的,真的干活的 agent,再基于这些 context 去更好的解决问题。
说真的,我当时跟哪些朋友聊天的时候,我听完他们的创业想法之后直接就跟他们说不要为了创业而创业了() 现在看来情商有点低wwww
因为我一直觉得… 这种东西终究是要被手机厂做掉的,而且最佳型态是其他产品/系统的一部分,作为一个创业公司,除了让简历变好看以外,看不到什么未来。
但我永远欢迎有谁来改变我的想法() 就像当时刚用上 ChatGPT 时,我可没想到这玩意儿能变成廉价智能改变这么多东西
--【肆】--:
我所说的本地是指agent的流程、工具调用都发生在本地,并不是说本地模型。本地模型效果太拉了
--【伍】--:
agent还是要本地跑吧,手机上用agent不就是为了帮用户进行操作吗?
--【陆】--:
这么看来,实际上手机上的 agent 最好不要跑在手机本地?
我们的核心观点之一是手机上有丰富的 context 信息可以采集,也有更简便的第三方服务交互方式,可以直接用 gui 模型完成一些任务,比如查高德地图之类的,用不上使用API来完成,而是直接在用户手机内做。但实际上,确实感觉意义不大,而且实际效果感觉被skills脚本完爆了
当生产力工具还是差很多,只能当小玩具。
--【柒】--:
gui agent只是一小部分功能
--【捌】--:
太难做了
往期帖子发了几个开源推广贴,感觉大家都不怎么感兴趣。估计是我们的软件没有解决各位佬日常手机使用的痛点!
所以想问问,和大家讨论一下手机上的agent实现哪些事情是有意义的?
我个人觉得,写代码应该是没意义的。签到薅羊毛是有意义的…
网友解答:--【壹】--:
咳,我记得去年或前年一些朋友搞创业就是做的这个方向,后来黄了,但除了卖给手机厂以外,我一直不太懂这个场景创业的长期 vision 是什么(
我曾经考虑,这样的产品可以作为 AI 陪伴的一部分 (因为我当时在搞 AI 陪伴,Open-LLM-VTuber咩),因为我一直认为,像是 AI 陪伴这样的 “入口”,在获取了长期记忆积累之后,做任何任务,都能携带这长期记忆,来比任何独立的应用,更能帮助到用户。但说真的有些牵强(),不能支撑手机 agent 本身作为独立的业务创业。
其实我觉得浏览器 agent 也有一点点这样的问题。这种 UI agent,本质上依赖一个假设: 用户花时间在浏览器/手机上,是为了解决一些问题。如果有人能帮他们做这些事,他们宁愿不用手机。但很多时候,人用浏览器,用手机,并不是… 痛苦的。这使得浏览器 agent 只能在少数几种机械化任务上发挥作用,而且很多集中在白嫖上。当然,浏览器 + AI 本身非常有用,但浏览器 agent 的有用性,在我看来没有那么强。手机 UI agent 在我看来也是这样。我们有哪些任务是必须在手机上做,是偏机械化的,可以被 AI 代替的呢?现阶段,在我看来是比较少的。
可能一个重要的 use case,在我看来,是作为自动化测试的一部分,打通 AI coding agent 的开发和测试闭环,让 AI coding agent 写完东西,可以自己上手摸产品,然后再改进。不过我不了解移动端开发,所以不太确定这种场景需不需要 UI agent,说不定其实一个 adb 或是现有的测试框架就解决了问题。
另一个可能的 use case,或者说一个可能的长期 vision,可以说,让 AI agent 完全替代你去工作。一个能操作你手机的 AI,能更全面的帮你解决更多问题,比如帮你回消息或买东西之类的…? 但我觉得更理想的形式,还是在电脑上或者云端。另外,这需要一个长期记忆,这需要一个更有用,更全面的 agent,毕竟你的工作和生活也不全发生在手机内。
随便啦,我想听听别人的想法。我上面提到的所有观点都完全不坚定且欢迎反驳。
--【贰】--:
手机计算能力带不动足够好的模型吧,但是个人信息用上云端模型也有点隐私泄露的威胁…
端侧云侧各有各的问题
--【叁】--: advent:
这么看来,实际上手机上的 agent 最好不要跑在手机本地?
那还能叫手机 agent 吗 不过我确实就是也是这么想的(
我觉得我理想中的 agent,核心可能是在云端的,它可能有触手,可以操作你的设备,你的手机,但也有自己的空间去做工作。它自己有空间,所以他干活时,你还是可以用自己的设备。真的干长时间的正经活,如果他占用了你的手机,那你用什么?当然也有手机上到底什么活需要 AI 来做的问题 (肯定还是有,但… 有哪些是硬需求,硬到让用户愿意下载一个 UI agent,是值得讨论的)。
手机 agent 的核心优势确实就是 context,而不是作为执行任务的地方 (此为暴论)。
可能不见得是主要做工作的地方,而是获取上下文,做针对用户的 deep research 的地方。而在云端的,真的干活的 agent,再基于这些 context 去更好的解决问题。
说真的,我当时跟哪些朋友聊天的时候,我听完他们的创业想法之后直接就跟他们说不要为了创业而创业了() 现在看来情商有点低wwww
因为我一直觉得… 这种东西终究是要被手机厂做掉的,而且最佳型态是其他产品/系统的一部分,作为一个创业公司,除了让简历变好看以外,看不到什么未来。
但我永远欢迎有谁来改变我的想法() 就像当时刚用上 ChatGPT 时,我可没想到这玩意儿能变成廉价智能改变这么多东西
--【肆】--:
我所说的本地是指agent的流程、工具调用都发生在本地,并不是说本地模型。本地模型效果太拉了
--【伍】--:
agent还是要本地跑吧,手机上用agent不就是为了帮用户进行操作吗?
--【陆】--:
这么看来,实际上手机上的 agent 最好不要跑在手机本地?
我们的核心观点之一是手机上有丰富的 context 信息可以采集,也有更简便的第三方服务交互方式,可以直接用 gui 模型完成一些任务,比如查高德地图之类的,用不上使用API来完成,而是直接在用户手机内做。但实际上,确实感觉意义不大,而且实际效果感觉被skills脚本完爆了
当生产力工具还是差很多,只能当小玩具。
--【柒】--:
gui agent只是一小部分功能
--【捌】--:
太难做了

