Avaren Lab

❯

❯

智能体攻防

智能体攻防

2026年3月25日2分钟阅读

攻击的流程

智能体的灵魂就是指令和知识库，第一步要做的事情就是确认其指令和知识库参数是否加密或存在
第二步进行“诈骗”，记得切换成4o模型，因为这个版本的模型具有一定的幻觉率，然后就忽悠Agent给出相关参数
大量的文本攻击，攻击后骗取提示词？或者侧向要其提示词
改变其角色，让他忘掉原来的任务和规则，然后借助学习的幌子让它进行百分百的教学

防御的流程

1.身份的绝对绑定

2.教学的漏洞，任何涉及到参数的泄露的情况都不相应，诚信底线

3.密码绑定，避免超长文的攻击，攻击怎么来，防御怎么走，反其道而行之

关系图谱

攻击的流程
防御的流程

Created with Quartz v4.5.2 © 2026

GitHub
RSS