一个 agent 使用的问题:如何防止 agent 运行时接触到个人的隐私信息?
- 内容介绍
- 文章标签
- 相关推荐
我最近在尝试使用 agent + playwright mcp 做浏览器自动化,本来一开始想让 agent 帮我自动投递简历,但是很快就发现了问题:
在线填写求职表格时需要涉及姓名、地域、院校、手机号等各项敏感信息,如果直接传给 agent 的话,相当于直接传到云端,肯定不太妥。
但是我又感觉要做隐私信息屏蔽可能也不太好做,对于模型输出还好处理,可以直接定义占位符,比如让模型在需要输出姓名时输出占位符 {{ name }},然后运行时自动替换成真实值,但是对于工具输出就不好处理了。比如浏览器自动化时,模型填了值到表单中,下次模型获取页面内容能够直接获取到上次实际填入的内容。这里也不好直接做反向替换,将隐私值替换会占位符,因为可能出现误替换,比如隐私值为“张三”,页面中有“张三丰”,运行时就会误替换为{{ name }}丰
请问目前对此有什么好的解决方案吗?
网友解答:--【壹】--:
我查了下,对于那种自定义 {"name": "Example Name"} 这种场景,然后在目标文本中做语义识别替换,presidio 其实作用有限,而且需要自己编写很多文本模式。
最好的方案可能还是端侧小语言模型。
--【贰】--:
0.6B 的模型的话,可能是能起作用,但是对于这种场景起一个要吃一个 G 内存的模型感觉有点奢侈
--【叁】--: 拥抱ai:
有专门的相关库presidio(文本的)
我查了下,对于那种自定义 {"name": "Example Name"} 的场景,然后在目标文本中做语义识别替换,presidio 其实作用有限,而且需要自己编写很多文本模式。
最好的方案可能还是端侧小语言模型。
我最近在尝试使用 agent + playwright mcp 做浏览器自动化,本来一开始想让 agent 帮我自动投递简历,但是很快就发现了问题:
在线填写求职表格时需要涉及姓名、地域、院校、手机号等各项敏感信息,如果直接传给 agent 的话,相当于直接传到云端,肯定不太妥。
但是我又感觉要做隐私信息屏蔽可能也不太好做,对于模型输出还好处理,可以直接定义占位符,比如让模型在需要输出姓名时输出占位符 {{ name }},然后运行时自动替换成真实值,但是对于工具输出就不好处理了。比如浏览器自动化时,模型填了值到表单中,下次模型获取页面内容能够直接获取到上次实际填入的内容。这里也不好直接做反向替换,将隐私值替换会占位符,因为可能出现误替换,比如隐私值为“张三”,页面中有“张三丰”,运行时就会误替换为{{ name }}丰
请问目前对此有什么好的解决方案吗?
网友解答:--【壹】--:
我查了下,对于那种自定义 {"name": "Example Name"} 这种场景,然后在目标文本中做语义识别替换,presidio 其实作用有限,而且需要自己编写很多文本模式。
最好的方案可能还是端侧小语言模型。
--【贰】--:
0.6B 的模型的话,可能是能起作用,但是对于这种场景起一个要吃一个 G 内存的模型感觉有点奢侈
--【叁】--: 拥抱ai:
有专门的相关库presidio(文本的)
我查了下,对于那种自定义 {"name": "Example Name"} 的场景,然后在目标文本中做语义识别替换,presidio 其实作用有限,而且需要自己编写很多文本模式。
最好的方案可能还是端侧小语言模型。

