关于模安局
模安局不是一个真正的"局",也不是什么学术机构——它是一个聚焦 AI 模型安全、治理与风险边界的独立观察站。
过去几年,我们在谈论 AI 安全时,往往习惯性地停留在内容对抗和红蓝对抗的层面。但这远远不够。当 AI 从"说话"走向"做事",当传统 LLM 这种无状态问答系统进化为能够跨环境执行任务的 Agent,我们面临的风险威胁早就不是同一个层级上的东西了。
建立这里的初衷,就是把复杂、抽象的 AI 安全与治理问题,剥离学术腔调,用人话说明白。这既是写给我自己的思考笔记,也是写给在这个行业里摸爬滚打的同路人的一份备忘录。
/ 面向谁
学术界:高校师生与研究者
这里没有严谨的论文格式,但希望能为你提供真实视角的产业观察。如果你在做 AI 安全与治理研究,这里可以作为了解行业一线的参考文献,或是你发表观点的发声平台。
产业界:企业与安全厂商
给企业内 AI 安全/合规负责人、一线攻防人员,以及安全厂商的产品经理与售前。这里聊的是实际业务中踩过的坑,和真正能指导工程落地的架构图。
独立研究机构与测评方
关注大模型能力边界与安全基准的研究员。安全基准不是简单的错词本,这里提供另一种视角的风险度量标准和攻防拆解。
破圈关注者:政策、媒体与投资人
如果你想剥开各种玄乎的技术"黑话",看清 AI 风险的真实面貌与商业逻辑,这里或许是个直接、不绕弯子的切入口。
/ 写作原则
拒绝学术包装
不写故作高深的废话,不生产正确的学术结论。把复杂问题说明白,只讲能落地的逻辑和直白的道理。
不站台不背书
这里不为任何机构或产品吹号角。好就是好,坑就是坑,只讲事实,不讲客套话。
剥离情绪判断
不用情绪化词汇带节奏,所有的推演和分析,尽量回到技术机制、安全规则和商业逻辑本身。
基于可验证事实
所有的拆解和推演,都必须建立在公开可查的信息与切实的产业现象之上,不做无端臆测。
/ 背后的人
管铭
AI 安全产品负责人 / 模安局作者
长期在这个圈子里死磕大模型安全和 AI 治理。做过大模型安全相关的国家标准,也参与过几份行业框架白皮书的起草。
曾先后在华为、旷视、数美摸爬滚打。目前在 360 带团队,主攻大模型应用安全产品能力的建设与落地。
* 声明:本站仅为个人思考与观察记录,不代表任何供职机构的立场。
欢迎探讨业务落地与纠错,联系邮箱:[email protected]
转载或引用请注明来源与原始链接。