코인정보

AI模型攻击增加,S2W发布新安全策略

柳청빛 기자 2026-04-16 16:03
提出AI攻击四大类型:输入操控、完整性破坏、合成身份等 现有系统安全有限,需应对AI逻辑结构漏洞
4月15日,S2W在城南板桥总部举办的AI时代安全策略研讨会
4月15日,S2W在城南板桥总部举办的AI时代安全策略研讨会 [图片来源:S2W]

【经济日报】随着人工智能(AI)技术的普及,绕过现有安全系统的新型网络攻击不断增加,企业需要转变安全策略。特别是针对AI模型的攻击增多,建立AI专用的安全应对体系变得尤为重要。


16日,S2W在城南板桥总部举办了主题为“AI时代的新安全策略:通过实际案例了解应对措施”的私密研讨会,向客户分享了AI安全威胁案例和应对方案。


S2W指出,随着AI技术的扩展,出现了不同于以往的攻击方式。主要的AI特化攻击方式包括“输入操控”、“完整性破坏”、“代理关联”和“合成身份”。


“输入操控”通过提示注入或越狱技术绕过大型语言模型(LLM)的保护机制,导致敏感信息泄露或执行非预期命令。攻击者通过扰乱模型的响应逻辑获取系统内部信息或进行进一步攻击。


“完整性破坏”是通过数据投毒和后门攻击污染学习数据或搜索增强生成(RAG)知识库,特点是长期逃避检测。


“代理关联”攻击利用处理外部数据的AI代理间接进行攻击,传递隐藏命令以诱导API调用或数据删除等二次攻击。


“合成身份”攻击利用深度伪造和语音克隆技术生成精细的假身份,用于绕过生物认证或提高网络钓鱼的可信度,威胁企业安全。


AI模型直接攻击的实际案例也在增加。用户利用各种提示工程技术绕过AI模型的保护机制,获取内部信息。S2W解释说,简单的对话如角色赋予或绕过问题就能使AI模型变得脆弱。


此外,S2W还公开了攻击者通过提取内部标识符、窃取系统提示、暴露优惠券代码等方式进行免费机票预订的案例。AI模型及其连接的整个系统结构都可能成为攻击目标,尤其在多模态环境中,仅通过图像操控就能使验证系统失效。


在AI环境中,单靠现有的安全方式难以应对。传统安全以系统漏洞和错误为中心,而AI安全则需防御模型的判断逻辑和认知结构的漏洞。


由于AI模型的结果会因学习数据和提示输入而异,攻击者可能利用逻辑漏洞。因此,需要从阻断型安全转向实时检测和应对型安全体系。


由于AI特性难以实现完美防御,持续的模拟攻击和漏洞管理变得重要。企业需在AI服务运营过程中预先检查可能出现的风险,以加强应对策略。


S2W攻防部门负责人梁钟宪表示:“利用AI进行安全防护的目标是快速检测绕过尝试,建立动态防御体系,不断更新政策,提高攻击者的攻击成本和放弃可能性。”他还表示:“未来将进一步深化从攻击者视角的漏洞发现和场景验证研究,提供能消除AI时代不安的行动方案。”





※ 本报道经人工智能(AI)系统翻译与编辑。

《 亚洲日报 》 所有作品受版权保护,未经授权,禁止转载。