Agent Skill 八类风险与三层防护架构(Snyk,2026.2)
Snyk 报告扫描 3984 个 Agent Skill,发现八类安全风险(提示注入、恶意代码、可疑下载、凭证处理、密钥泄露、第三方内容、远程执行、高危权限),并提出安装前检测、运行时管控、生态治理三层防护架构,指出 Skill 已成为组合攻击的新型供应链入口。
模安局 文章列表
支持按专题与标签筛选,并切换最新或推荐排序。
Snyk 报告扫描 3984 个 Agent Skill,发现八类安全风险(提示注入、恶意代码、可疑下载、凭证处理、密钥泄露、第三方内容、远程执行、高危权限),并提出安装前检测、运行时管控、生态治理三层防护架构,指出 Skill 已成为组合攻击的新型供应链入口。
AgentDoG 1.5 在三维风险分类框架基础上扩展了 OpenClaw 和 Codex-style Agent 新执行场景,发布 ATBench-Claw 与 ATBench-Codex 评测集,训练了 0.8B–8B 可部署的轻量安全诊断模型,并引入在线 Pre-Reply 护栏,将 Agent 安全从轨迹诊断推进到运行时治理。
Google Beyond Zero 提出 Agent 时代企业安全新范式,将零信任从应用级访问控制下沉到动作级上下文判断,引入企业安全世界模型、意图验证、行为约束和 Agent 身份管理,构建四层架构应对 AI Agent 带来的新攻击面。
SandboxBench 提出首个专门评测 AI Agent 沙箱突破能力的框架,用 27 个 Docker/Kubernetes 挑战测试 Agent 能否完成容器逃逸、数据外传、横向移动、持久化和自我复制,填补了传统工具只能发现风险点、无法验证 Agent 实际利用能力的评测空白。
OpenAI 发布前沿治理框架,把前沿模型上线条件从能不能安全回答问题升级为能不能证明高能力模型应该被允许上线
具身智能的越狱不只是模型说出不该说的话,而是机器人真的撞向行人或夹伤手指——RoboJailBench 提出首个覆盖18类物理风险的评测基准
Agentic AI 打破了高逼真欺骗与大规模攻击不能兼得的隐含约束——信任信号正在失效,防御重心必须从验证来源转向验证行为
Agent 威胁不在输入输出层,而藏在工具调用链路里——ADR 补上 EDR/XDR 看不见的 Agent 语义遥测盲区,让企业 Agent 安全进入检测响应时代
AI 的伦理判断不应被简化为二元分类,而应建模为结果主义、义务论与美德伦理三维分布——让 AI 在灰区场景暴露结论背后的价值结构
Agent 时代的 IAM 不能只回答谁能访问什么,还要回答它为什么访问——Purpose 是声明的职责边界,Intent 是运行时意图,两者必须同时治理