(网经社讯)6月26日,在ISC.AI 2026大会期间,360集团首席科学家、集团高级副总裁潘剑锋提出智能体安全治理全新范式,主张安全目标应从“防御确定威胁”转向“管控不确定性”。
据网经社AI台(AI.100EC.CN)获悉,潘剑锋指出,AI漏洞挖掘今年已将安全人员逼到墙角。大模型让计算从确定性走向不确定性,机器能理解人类意图,但也引入新型安全风险。他归纳不确定性来自两方面:外部攻击者可将恶意意图隐藏在输入中诱导模型;内部则源于大模型自身幻觉,在连续推理中可能被不断放大。
为此,潘剑锋提出智能体安全治理整体思路:在输入层识别恶意意图、推理层减少幻觉与错误判断、执行层限制行动边界。具体包括:通过“以模治模”的恶意意图识别引擎,利用360长期积累的搜索、安全攻防及合规等数据训练,实测可提升开源大模型安全性10%至30%;推理层通过自研世界认知模型为AI提供“认知锚点”,从源头抑制幻觉;执行层通过环境孪生沙箱监控工具调用和数据访问,确保错误不直接演变为安全事故。
谈及市场格局,潘剑锋判断智能体安全将成为标配基础设施,但不会被单一厂商垄断,而会像手机行业一样形成头部与专业厂商并存的格局。他强调AI厂商不会取代安全公司,但AI正重新划定安全行业门槛。


































.png)



