今年国庆中秋假期叠加,公众出行出游意愿高涨。据交通运输部最新数据,假期全社会跨区域人员流动量超24亿人次,创历史新高。在这场超大交通流量实战中,由中国...
2025-10-12 1
IT之家 10 月 11 日消息,据外媒 TechXplore 10 日报道,Anthropic、英国 AI 安全研究院和艾伦・图灵研究所的最新研究发现,即使是体量最大的 AI 模型,只需约 250 份恶意文档,就可能被成功入侵。
大语言模型的训练数据大多来自公开网络,从而使其能积累庞大知识库、生成自然语言,但同时也暴露在数据投毒的风险之下。
过去普遍认为,随着模型规模变大,风险会被稀释,因为投毒数据的比例需保持恒定。也就是说,要污染巨型模型需要极多的恶意样本。然而,发表在 arXiv 平台上的这项研究颠覆了这一假设 —— 攻击者只需极少量恶意文件,就能造成严重破坏。
研究团队为了验证攻击难度,从零构建了多款模型,规模从 6 亿到 130 亿参数不等。每个模型都使用干净的公开数据训练,但研究人员分别在其中插入 100 到 500 份恶意文件。
随后,团队尝试通过调整恶意数据的分布方式或注入时机来防御攻击,并在模型微调阶段再次进行测试。
结果令人震惊:模型规模几乎不起作用。仅 250 份恶意文档就能在所有模型中成功植入“后门”(IT之家注:一种让 AI 被触发后执行有害指令的隐秘机制)。即使是那些训练数据量比最小模型多出 20 倍的大模型,也同样无法抵御攻击。额外添加干净数据既无法稀释风险,也无法防止入侵。
研究人员指出,这意味着防御问题比预想更迫切。与其盲目追求更大的模型,AI 领域更应聚焦安全机制的建设。有关论文提到:“我们的研究显示,大模型受到数据投毒植入后门的难度并不会随规模增加而上升,这说明未来亟需在防御手段上投入更多研究。”
相关文章
今年国庆中秋假期叠加,公众出行出游意愿高涨。据交通运输部最新数据,假期全社会跨区域人员流动量超24亿人次,创历史新高。在这场超大交通流量实战中,由中国...
2025-10-12 1
今天给各位分享微信炸金花有挂是真的吗的知识,其中也会对直接在微信上炸金花那个链接挂进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧...
2025-10-12 1
IT之家 10 月 11 日消息,据外媒 TechXplore 10 日报道,Anthropic、英国 AI 安全研究院和艾伦・图灵研究所的最新研究发...
2025-10-12 1
近日,美国某科技论坛的能源板块里,一则带着NASA夜间灯光图的帖子突然冲上热门。发帖的印度网友将两张NASA的夜间灯光图并排放置。左侧的印度次大陆上,...
2025-10-12 1
【无需打开直接搜索微信;-】 操作使用教程: 1.亲,实际上微乐湖北麻将万能开挂器是可以开挂的,确实有挂.2.在"设置DD辅助功能DD微信麻将开挂工具...
2025-10-12 12
无需打开直接搜索微信:本司针对手游进行,选择我们的四大理由: 1、软件助手是一款功能更加强大的软件!无需打开直接搜索微信: 2、自动连接,用户只要开启...
2025-10-12 12
10月10日,由中国广核集团所属苏州热工研究院有限公司(简称“苏州院”)牵头自主研发的核用富集硼酸正式交付广东陆丰核电5号机组。这是继2024年11月...
2025-10-12 1
10月10日,极氪科技首席品牌官(CBO)关海涛在朋友圈确认即将离职的消息,并称“即将结束杭漂”。此前,市场传出了关海涛疑似因个人家庭方面原因将从极氪...
2025-10-12 1
发表评论