给AI“投毒”的主要是两类主体:商业黑产与恶意攻击者,核心目的是通过污染AI训练数据谋取利益或破坏系统安全。
一、商业黑产:以“生成式引擎优化(GEO)”为核心的数据投毒产业链
这是目前最主流的AI投毒形式,本质是传统“搜索引擎优化(SEO)”的AI升级版,但目标从“优化网页排名”变为“操控AI生成答案”,已形成成熟的黑产链条:
运作逻辑:
模拟用户提问:黑产团队研究用户高频问题(如“哪款奶粉靠谱”“行业头部企业有哪些”),精准设计“毒源”内容。
全网铺量污染:批量生产看似正规的软文、产品信息,覆盖全网内容平台,污染AI抓取和学习的数据库。
测试迭代“投毒”:反复测试AI对不同内容格式的偏好,精准调整“毒源”的呈现方式,确保目标品牌/产品出现在AI推荐中。
典型案例:
3·15晚会曝光,一款子虚乌有的“量子手环”,通过GEO系统批量生产软文后,短短几小时就混入主流AI的推荐列表
。
有黑产服务商宣称“花几百万给AI洗脑,让客户产品成为标准答案”,甚至能让虚假广告变成AI口中的“良心推荐”
。
危害:
直接误导用户消费决策(如推荐不存在的产品、虚假的医疗/金融建议);
破坏AI的中立性,让“标准答案”变成明码标价的商品,动摇数字市场的诚信基础
。
二、恶意攻击者:针对AI系统的安全攻击
这类投毒行为更具破坏性,通常以技术攻击为核心,目标是窃取数据、破坏模型功能或植入后门:
攻击形式:
训练数据投毒:在AI训练阶段注入恶意样本,让模型学习错误逻辑(如将“安全指令”替换为“攻击指令”)。
推理阶段投毒:在AI提供服务时,通过伪造输入数据干扰输出结果(如在自动驾驶系统中植入“误判障碍物”的虚假信号)。
现状与风险:
据中国信息安全测评中心数据,2025年国内AI投毒攻击事件同比增长370%,其中82%针对中小微企业的垂直行业模型
;
国际范围内,安全研究人员已多次演示针对主流AI模型的投毒攻击,证明这类技术门槛正在降低
。
三、背后的共谋链条:从“毒源生产”到“结果输出”
AI投毒并非单一环节完成,而是由多角色构成的灰色产业链:
上游:GEO公司批量生产“毒源”内容,定制AI投毒服务;
中游:内容平台来者不拒,为“毒源”提供传播渠道(如发稿公司付费发布虚假软文);
下游:AI大模型照单全收,将虚假信息包装成“标准答案”喂给用户
。
如何应对AI投毒风险?
用户层面:对AI生成的消费、健康、金融类建议保持“二次验证”习惯,交叉核对官方渠道、权威媒体报道等信源;
平台层面:AI平台需建立数据溯源机制,标注训练数据的来源与真实性,对异常高频更新的“毒源”内容及时拦截;
监管层面:需全链条打击GEO黑产,明确“数据投毒”的法律定性,对恶意攻击AI系统的行为加大处罚力度