AI玩手游,关于GEMINI相关的视觉识别问题
- 内容介绍
- 文章标签
- 相关推荐
问题描述:
--【壹】--:
--【贰】--:
--【叁】--:
--【肆】--:
--【伍】--:
image1077×993 171 KB
有没有大佬知道GUI能力还有没有更强的模型呢?
我在弄AI控制玩手游
网友解答:--【壹】--:
以AI OCR的速度,大概只能玩回合制游戏吧
我之前搞了一个AR程序,就是看见英文即翻译中文的程序,体验很差,就是因为OCR太慢了,就算我加了画面防抖动算法,仍然需要长时间的准确对准文字才行,怪不得百度翻译会做成拍照翻译呢。
--【贰】--:
智普有一个autoglm可以去看看?
--【叁】--:
好的,我去看看
--【肆】--:
但是机器人真要落地,肯定要很快的OCR速度才行吧,感觉识别图片内容已经是简单版了
--【伍】--:
AI不能直接玩,你可以写一个中间做信息整理给AI,AI作为决策层去下发指令去玩,这才是高效的方式
问题描述:
--【壹】--:
--【贰】--:
--【叁】--:
--【肆】--:
--【伍】--:
image1077×993 171 KB
有没有大佬知道GUI能力还有没有更强的模型呢?
我在弄AI控制玩手游
网友解答:--【壹】--:
以AI OCR的速度,大概只能玩回合制游戏吧
我之前搞了一个AR程序,就是看见英文即翻译中文的程序,体验很差,就是因为OCR太慢了,就算我加了画面防抖动算法,仍然需要长时间的准确对准文字才行,怪不得百度翻译会做成拍照翻译呢。
--【贰】--:
智普有一个autoglm可以去看看?
--【叁】--:
好的,我去看看
--【肆】--:
但是机器人真要落地,肯定要很快的OCR速度才行吧,感觉识别图片内容已经是简单版了
--【伍】--:
AI不能直接玩,你可以写一个中间做信息整理给AI,AI作为决策层去下发指令去玩,这才是高效的方式

