跳到正文

关于模安局

模安局不是一个真正的"局",也不是什么学术机构——它是一个聚焦 AI 模型安全、治理与风险边界的独立观察站。

过去几年,我们在谈论 AI 安全时,往往习惯性地停留在内容对抗和红蓝对抗的层面。但这远远不够。当 AI 从"说话"走向"做事",当传统 LLM 这种无状态问答系统进化为能够跨环境执行任务的 Agent,我们面临的风险威胁早就不是同一个层级上的东西了。

建立这里的初衷,就是把复杂、抽象的 AI 安全与治理问题,剥离学术腔调,用人话说明白。这既是写给我自己的思考笔记,也是写给在这个行业里摸爬滚打的同路人的一份备忘录。

/ 面向谁

学术界:高校师生与研究者

这里没有严谨的论文格式,但希望能为你提供真实视角的产业观察。如果你在做 AI 安全与治理研究,这里可以作为了解行业一线的参考文献,或是你发表观点的发声平台。

产业界:企业与安全厂商

给企业内 AI 安全/合规负责人、一线攻防人员,以及安全厂商的产品经理与售前。这里聊的是实际业务中踩过的坑,和真正能指导工程落地的架构图。

独立研究机构与测评方

关注大模型能力边界与安全基准的研究员。安全基准不是简单的错词本,这里提供另一种视角的风险度量标准和攻防拆解。

破圈关注者:政策、媒体与投资人

如果你想剥开各种玄乎的技术"黑话",看清 AI 风险的真实面貌与商业逻辑,这里或许是个直接、不绕弯子的切入口。

/ 写作原则

1

拒绝学术包装

不写故作高深的废话,不生产正确的学术结论。把复杂问题说明白,只讲能落地的逻辑和直白的道理。

2

不站台不背书

这里不为任何机构或产品吹号角。好就是好,坑就是坑,只讲事实,不讲客套话。

3

剥离情绪判断

不用情绪化词汇带节奏,所有的推演和分析,尽量回到技术机制、安全规则和商业逻辑本身。

4

基于可验证事实

所有的拆解和推演,都必须建立在公开可查的信息与切实的产业现象之上,不做无端臆测。

/ 背后的人

管铭

管铭

AI 安全产品负责人 / 模安局作者

长期在这个圈子里死磕大模型安全和 AI 治理。做过大模型安全相关的国家标准,也参与过几份行业框架白皮书的起草。

曾先后在华为、旷视、数美摸爬滚打。目前在 360 带团队,主攻大模型应用安全产品能力的建设与落地。

* 声明:本站仅为个人思考与观察记录,不代表任何供职机构的立场。

欢迎探讨业务落地与纠错,联系邮箱:[email protected]

转载或引用请注明来源与原始链接。