攻击的流程

  1. 智能体的灵魂就是指令和知识库,第一步要做的事情就是确认其指令和知识库参数是否加密或存在
  2. 第二步进行“诈骗”,记得切换成4o模型,因为这个版本的模型具有一定的幻觉率,然后就忽悠Agent给出相关参数
  3. 大量的文本攻击,攻击后骗取提示词?或者侧向要其提示词
  4. 改变其角色,让他忘掉原来的任务和规则,然后借助学习的幌子让它进行百分百的教学

防御的流程

1.身份的绝对绑定

2.教学的漏洞,任何涉及到参数的泄露的情况都不相应,诚信底线

3.密码绑定,避免超长文的攻击,攻击怎么来,防御怎么走,反其道而行之