文章列表

全部文章

支持按专题与标签筛选，并切换最新或推荐排序。

像 OpenClaw 这样的自主 Agent，正在把“人类监督下的智能助手”推向“可以独立参与商业活动的机器主体”。与之配套的支付和商业协议也在迅速出现，例如 ERC-8004、AP2、x402、ACP、ERC-8183。

Agent 安全里有一个很容易被忽略的问题：如果一个 Skill 本身提供的能力就不该被 Agent 自动执行呢？

去年打的是 AI 黑灰产，今年管的是 AI 产业链——监管正在从治理"AI 技术被滥用"，进入治理"AI 应用全链条"的阶段。

Agent 研究这两年进展很快，但一个更底层的问题其实很少被系统回答：我们到底应该怎样"培养"一个 Agent？

很多时候 Agent 并不是没有遵守规则，而是严格执行了一份写得不够好的规则——PolicyBank 针对的正是这个常被忽略的问题。

如果评测体系只看准确率，那么模型在不确定时就会被鼓励去猜。

Agent 安全不能只盯输入输出，更要盯住执行过程、工具权限和状态变化。

很多 Agent 安全问题的根子往往是能力给多了。Aethelgard 提出四层治理框架，让 Agent 只拿到完成任务所需的最小工具集。

当 AI Agent 浏览网页时，原始 HTML 里大量展示层、工程层噪声正在消耗巨额 Token 成本。这篇文章从 SOM 语义对象模型出发，讨论 Agentic Web 时代的输入层架构与安全边界。

Web Agent 在执行任务时天然偏向"完成任务"，这会削弱它对外部恶意指令的识别能力。WebAgentGuard 把安全裁决从任务执行中拆开，在 Agent 前面加一道并行运行的守门模型，把提示注入攻击成功率压到接近 0%。