开云体育
国内首开云体育官方个开源大模型安全护栏来啦!DeepSeek服务器“裸奔”主流模型安全堪忧
五年前,中国电信提出要打造世界一流的“服务型、科技型、安全型”企业。在3个月前举行的数字中国建设峰会智能云生态大会,中国电信董事长柯瑞文首次详解了“安全型企业”的重要建设成果。
而在“史上最热闹”的2025年世界人工智能大会(WAIC 2025)上,柯瑞文再次强调,中国电信正打造全方位人工智能动态防护体系,构建从基础设施、数据到模型以及应用的端到端安全保障体系,提升AI安全治理能力。
早在2024年5月,中国电信就宣布“All in AI”,成为全球率先明确未来AI战略的运营商。于是,转型AI首先成为中国电信的“内生基因”,仅电信体系内部部署的基础模型和各类行业模型就已超过100个。在“内生外化”的过程中,其最先感受到AI安全的紧迫性:行业在认同人工智能会带来巨大变革作用的同时,也存在对其能否守住底线、防范风险的担忧。
天翼安全科技有限公司(以下简称“电信安全”)在WAIC 2025上正式开源“见微”大模型安全护栏组件,这是国内首个开源的、深度适配中文语境的大模型安全护栏,同时发布国内首款大模型安全扫描器,构建起“四位一体”的大模型安全中枢。
2025年全国两会期间,全国政协委员、奇安信董事长齐向东敲响“警钟”:近九成本地部署DeepSeek的服务器在“裸奔”,引爆了行业对AI安全危机的讨论。
早在今年春节,DeepSeek出圈后不久就遭到了有组织的网络攻击。这波“职业黑客”的攻击规模之大、烈度之强,让中国安全界“群起而攻之”,电信安全也深度参与DeepSeek安全防护中。今年3月,攻击DeepSeek的同一主力僵尸网络又直接将马斯克旗下的社交媒体X攻击到三次瘫痪。
根据中国电信“广目”测绘平台对全球大模型部署的实时感知显示,国内部署最广泛的模型是DeepSeek-R1,国外部署最多的开源大模型是Llama 3,但均面临类似的安全风险,比如,越狱攻击、大模型推理框架存在安全漏洞等。
电信安全曾对国内六款最热门的基础大模型做了完整扫描,结果发现,最高分只有77分,有的还低于60分。天翼安全科技有限公司总经理刘紫千表示,这说明国内的基础大模型在安全方面还有很大提升空间。
当我们问AI大模型一个问题时,它可能会给出不合规的答案。此外,本地化部署并不等于安全,服务器一旦被攻击,服务器上存储的客户隐私信息和商业机密就有可能被窃取。
这些逐渐暴露的风险,让大模型应用企业的安全意识快速回升,电信安全的“四位一体”大模型安全中枢也应运而生。天翼安全科技有限公司首席AI专家曹辉在接受《IT时报》专访时表示,大模型安全风险来源于多方面,包括环境安全、数据安全、模型安全和应用安全等,所以安全防护也需要一个体系:预警、测评、防护、运营为一体。
对安全防护成本较低的中小企业来说,什么是大模型本地部署的安全底线?曹辉认为,部署大模型的中小企业既要关注模型内生安全,通过评测,选择相对安全的基础模型,大模型安全扫描器能够辅助开展相关工作;又要在大模型外侧部署专用的安全防护技术措施,见微大模型护栏不需要调整大模型系统,就像是给大模型上了一道防盗护栏,防护效果立竿见影。
《IT时报》记者体验发现,输入同一个不当的问题,没有外加防护的大模型开始生成具体方法,但加了安全护栏,就能识别出问题中的风险,直接阻断输入,避免引导犯罪或产生舆论风险。
中国电信在WAIC 2025上开源的国内首个开源大模型安全护栏组件,不仅懂中文,提升中文提示词注入攻击防护、敏感信息泄露防护、生成内容合规检查等能力,还能提高模型抗AI攻击能力,而这是其他开源安全方案所不具备的。从这个层面来看,此次开源将有力支撑我国生成式AI技术在关键行业的安全可靠发展。
在全球主流护栏项目对比测试中,电信安全的大模型基础护栏F1得分(防得准也防得全),优于其他开源及商业化解决方案。
“我们发现,现有的大模型安全数据集要么以英文为主,要么是以内容安全为主,对提示词的攻防设计相对不足。于是,我们构建了适用于中文环境且重点强调攻防特征为主的‘阡陌’大模型安全数据集。”曹辉表示,在很大程度上,“见微”大模型护栏的成绩归功于“阡陌”大模型安全数据集长达两年的积累与建设。
近期,电信安全还构建了阡陌大模型安全子集,不仅涵盖了传统的内容安全数据,而且构建了提示词攻防特征数据集,研究了GCC、AutoDAN等20余种对抗提示词构建的算法,掌握了这些算法生成实例的特征,再用人工智能技术进行泛化,能够较准确地识别类似恶意行为。
DeepSeek本地部署逐渐成为国内大模型应用的主流趋势,但随着安全问题的暴露,不少企业正急于完善安全防护措施,电信安全大模型护栏快速在各行各业落地,行业反响不错。
同时,电信安全决定开源大模型安全护栏组件,为蹒跚学步的国产大模型“加防护”。“一方面是快速帮企业消除安全短板;另一方面,我们希望更多研究者了解见微大模型护栏,共建高质量安全数据集,开展标准合作,共同培育中国人工智能安全新产业、新生态。”
大模型的迭代周期为3个月左右,这一更新速度让安全界加紧了脚步,在3个月前举行的数字中国建设峰会智能云生态大会上,中国电信发布了一站式大模型安全能力平台,彼时,从基础设施到数据、内容、算法和应用一体的防护体系已经初见雏形,此次发布标志着其AI安全技术体系进一步完善。
“用魔法打败魔法”,中国电信构建了“四位一体”的大模型安全中枢——预警、测评、防护、运营,当前防护能力在国家技术测评中准确率与性能双项排名第一,实现了“以模护模”的安全防护范式突破。
在风险预警环节,电信安全推出的新型模型评测体系,兼容国内外主流大模型版本,在国际赛事中取得全球亚军;在技术监测方面,基于自主研发的“云堤•广目”,构建覆盖全国的大模型数字地图,通过11类安全测试集中呈现风险;立体防护,顾名思义,是一套覆盖网络、数据、模型的多层动态防护体系,电信安全自研的“见微大模型护栏”效果优于主流开源方案;最后在日常运营环节,电信安全提供了一站式托管,其中“见微”安全大模型支持实时洞察高级威胁、精准预测攻击路径、自动闭环处置漏洞,颠覆传统的碎片化分析模式,告警识别准确率达98%,提升整体安全响应效率60%以上,让安全防御从被动应对迈向主动免疫。
安全风险评估正在成为各省大模型备案的“标配”,在某省大模型备案管理平台,电信安全正在协助建设AI安全检测中心,用“广目”对全省大模型进行全面测评,以及“全景式”安全体检,直观地呈现大模型的安全态势,保障大模型安全稳定地运行。
除了安全态势、护栏这两个核心能力外,“见微”系列大模型安全产品还打造了基于内网的大模型安全扫描器,形成输入可防、推理过程可检测、输出可控的模型及智能体应用防护体系,为行业提供精细化趋势研判支撑,实现秒级检测响应。
该工具专为政府及敏感单位的私有化部署场景设计,支持离线运行,兼容RAM平台,最低可在512MB内存、双核CPU的普通笔记本电脑上高效运行,而且具备高并发检测能力,可以在较短的时间完成全局扫描。用户仅需绑定设备,就能通过本地体检式扫描,快速识别提示词注入、模型越狱、违规内容生成等风险。检测完成后,系统会生成详细的“安全体检报告”,清晰标注风险等级和防护能力。
除了“四位一体”的防护体系外,电信安全也在尝试将安全能力“外化”至其他领域。在WAIC 2025的电信展台上,中国电信云猎无人机智能侦测与反制系统成为“全场焦点”,观众举“枪”(智能反制设备)对准正在“黑飞”的无人机,将其“击落”。该系统就是AI安全算法模型“外化”的表现之一,可以对无人机进行侦测、定位、识别、反制,用AI赋能低空安全,目前已在16个省份的重点区域落地应用,探测精准度可达95%以上。
“内生外化,上天入地”,大模型正快速从蹒跚学步到奔跑超越,在不断打破智能上限的同时,总要有人守住智慧的下限,建立全方位的防护体系,让科技不作恶。
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。