All Pages Edit on GitHub

Agent Safety Checklist

Agent 的风险来自“模型可以选择工具并执行动作”。这份清单帮助你在设计 Agent 时控制权限、工具边界和失败后果。

是否真的需要 Agent

如果这些问题大多是否,优先使用普通 LLM 调用或固定 workflow。

工具设计

权限控制

高风险操作

这些操作默认需要确认:

确认信息应该包含操作对象、参数摘要、影响范围和撤销方式。

终止条件

Prompt Injection 防护

日志和审计

评测

上线前一句话原则

模型可以建议动作,但系统必须控制权限、确认和最终执行。