国内首开云体育官方个开源大模型安全护栏来啦！DeepSeek服务器“裸奔”主流模型安全堪忧

开云体育NEWS CENTER

您当前位置：首页 > 开云体育

国内首开云体育官方个开源大模型安全护栏来啦！DeepSeek服务器“裸奔”主流模型安全堪忧

2025-08-11

浏览次数：次

返回列表

　　开云体育[永久网址:363050.com]成立于2022年在中国，是华人市场最大的线上娱乐服务供应商而且是亚洲最大的在线娱乐博彩公司之一。包括开云、开云棋牌、开云彩票、开云电竞、开云电子、全球各地赛事、动画直播、视频直播等服务。开云体育,开云体育官方,开云app下载,开云体育靠谱吗,开云官网，欢迎注册体验！

国内首开云体育官方个开源大模型安全护栏来啦！DeepSeek服务器“裸奔”主流模型安全堪忧

　　五年前，中国电信提出要打造世界一流的“服务型、科技型、安全型”企业。在3个月前举行的数字中国建设峰会智能云生态大会，中国电信董事长柯瑞文首次详解了“安全型企业”的重要建设成果。

　　而在“史上最热闹”的2025年世界人工智能大会（WAIC 2025）上，柯瑞文再次强调，中国电信正打造全方位人工智能动态防护体系，构建从基础设施、数据到模型以及应用的端到端安全保障体系，提升AI安全治理能力。

　　早在2024年5月，中国电信就宣布“All in AI”，成为全球率先明确未来AI战略的运营商。于是，转型AI首先成为中国电信的“内生基因”，仅电信体系内部部署的基础模型和各类行业模型就已超过100个。在“内生外化”的过程中，其最先感受到AI安全的紧迫性：行业在认同人工智能会带来巨大变革作用的同时，也存在对其能否守住底线、防范风险的担忧。

　　天翼安全科技有限公司（以下简称“电信安全”）在WAIC 2025上正式开源“见微”大模型安全护栏组件，这是国内首个开源的、深度适配中文语境的大模型安全护栏，同时发布国内首款大模型安全扫描器，构建起“四位一体”的大模型安全中枢。

　　2025年全国两会期间，全国政协委员、奇安信董事长齐向东敲响“警钟”：近九成本地部署DeepSeek的服务器在“裸奔”，引爆了行业对AI安全危机的讨论。

　　早在今年春节，DeepSeek出圈后不久就遭到了有组织的网络攻击。这波“职业黑客”的攻击规模之大、烈度之强，让中国安全界“群起而攻之”，电信安全也深度参与DeepSeek安全防护中。今年3月，攻击DeepSeek的同一主力僵尸网络又直接将马斯克旗下的社交媒体X攻击到三次瘫痪。

　　根据中国电信“广目”测绘平台对全球大模型部署的实时感知显示，国内部署最广泛的模型是DeepSeek-R1，国外部署最多的开源大模型是Llama 3，但均面临类似的安全风险，比如，越狱攻击、大模型推理框架存在安全漏洞等。

　　电信安全曾对国内六款最热门的基础大模型做了完整扫描，结果发现，最高分只有77分，有的还低于60分。天翼安全科技有限公司总经理刘紫千表示，这说明国内的基础大模型在安全方面还有很大提升空间。

　　当我们问AI大模型一个问题时，它可能会给出不合规的答案。此外，本地化部署并不等于安全，服务器一旦被攻击，服务器上存储的客户隐私信息和商业机密就有可能被窃取。

　　这些逐渐暴露的风险，让大模型应用企业的安全意识快速回升，电信安全的“四位一体”大模型安全中枢也应运而生。天翼安全科技有限公司首席AI专家曹辉在接受《IT时报》专访时表示，大模型安全风险来源于多方面，包括环境安全、数据安全、模型安全和应用安全等，所以安全防护也需要一个体系：预警、测评、防护、运营为一体。

　　对安全防护成本较低的中小企业来说，什么是大模型本地部署的安全底线？曹辉认为，部署大模型的中小企业既要关注模型内生安全，通过评测，选择相对安全的基础模型，大模型安全扫描器能够辅助开展相关工作；又要在大模型外侧部署专用的安全防护技术措施，见微大模型护栏不需要调整大模型系统，就像是给大模型上了一道防盗护栏，防护效果立竿见影。

　　《IT时报》记者体验发现，输入同一个不当的问题，没有外加防护的大模型开始生成具体方法，但加了安全护栏，就能识别出问题中的风险，直接阻断输入，避免引导犯罪或产生舆论风险。

　　中国电信在WAIC 2025上开源的国内首个开源大模型安全护栏组件，不仅懂中文，提升中文提示词注入攻击防护、敏感信息泄露防护、生成内容合规检查等能力，还能提高模型抗AI攻击能力，而这是其他开源安全方案所不具备的。从这个层面来看，此次开源将有力支撑我国生成式AI技术在关键行业的安全可靠发展。

　　在全球主流护栏项目对比测试中，电信安全的大模型基础护栏F1得分（防得准也防得全），优于其他开源及商业化解决方案。

　　“我们发现，现有的大模型安全数据集要么以英文为主，要么是以内容安全为主，对提示词的攻防设计相对不足。于是，我们构建了适用于中文环境且重点强调攻防特征为主的‘阡陌’大模型安全数据集。”曹辉表示，在很大程度上，“见微”大模型护栏的成绩归功于“阡陌”大模型安全数据集长达两年的积累与建设。

　　近期，电信安全还构建了阡陌大模型安全子集，不仅涵盖了传统的内容安全数据，而且构建了提示词攻防特征数据集，研究了GCC、AutoDAN等20余种对抗提示词构建的算法，掌握了这些算法生成实例的特征，再用人工智能技术进行泛化，能够较准确地识别类似恶意行为。

　　DeepSeek本地部署逐渐成为国内大模型应用的主流趋势，但随着安全问题的暴露，不少企业正急于完善安全防护措施，电信安全大模型护栏快速在各行各业落地，行业反响不错。

　　同时，电信安全决定开源大模型安全护栏组件，为蹒跚学步的国产大模型“加防护”。“一方面是快速帮企业消除安全短板；另一方面，我们希望更多研究者了解见微大模型护栏，共建高质量安全数据集，开展标准合作，共同培育中国人工智能安全新产业、新生态。”

　　大模型的迭代周期为3个月左右，这一更新速度让安全界加紧了脚步，在3个月前举行的数字中国建设峰会智能云生态大会上，中国电信发布了一站式大模型安全能力平台，彼时，从基础设施到数据、内容、算法和应用一体的防护体系已经初见雏形，此次发布标志着其AI安全技术体系进一步完善。

　　“用魔法打败魔法”，中国电信构建了“四位一体”的大模型安全中枢——预警、测评、防护、运营，当前防护能力在国家技术测评中准确率与性能双项排名第一，实现了“以模护模”的安全防护范式突破。

　　在风险预警环节，电信安全推出的新型模型评测体系，兼容国内外主流大模型版本，在国际赛事中取得全球亚军；在技术监测方面，基于自主研发的“云堤•广目”，构建覆盖全国的大模型数字地图，通过11类安全测试集中呈现风险；立体防护，顾名思义，是一套覆盖网络、数据、模型的多层动态防护体系，电信安全自研的“见微大模型护栏”效果优于主流开源方案；最后在日常运营环节，电信安全提供了一站式托管，其中“见微”安全大模型支持实时洞察高级威胁、精准预测攻击路径、自动闭环处置漏洞，颠覆传统的碎片化分析模式，告警识别准确率达98%，提升整体安全响应效率60%以上，让安全防御从被动应对迈向主动免疫。

　　安全风险评估正在成为各省大模型备案的“标配”，在某省大模型备案管理平台，电信安全正在协助建设AI安全检测中心，用“广目”对全省大模型进行全面测评，以及“全景式”安全体检，直观地呈现大模型的安全态势，保障大模型安全稳定地运行。

　　除了安全态势、护栏这两个核心能力外，“见微”系列大模型安全产品还打造了基于内网的大模型安全扫描器，形成输入可防、推理过程可检测、输出可控的模型及智能体应用防护体系，为行业提供精细化趋势研判支撑，实现秒级检测响应。

　　该工具专为政府及敏感单位的私有化部署场景设计，支持离线运行，兼容RAM平台，最低可在512MB内存、双核CPU的普通笔记本电脑上高效运行，而且具备高并发检测能力，可以在较短的时间完成全局扫描。用户仅需绑定设备，就能通过本地体检式扫描，快速识别提示词注入、模型越狱、违规内容生成等风险。检测完成后，系统会生成详细的“安全体检报告”，清晰标注风险等级和防护能力。

　　除了“四位一体”的防护体系外，电信安全也在尝试将安全能力“外化”至其他领域。在WAIC 2025的电信展台上，中国电信云猎无人机智能侦测与反制系统成为“全场焦点”，观众举“枪”（智能反制设备）对准正在“黑飞”的无人机，将其“击落”。该系统就是AI安全算法模型“外化”的表现之一，可以对无人机进行侦测、定位、识别、反制，用AI赋能低空安全，目前已在16个省份的重点区域落地应用，探测精准度可达95%以上。

　　“内生外化，上天入地”，大模型正快速从蹒跚学步到奔跑超越，在不断打破智能上限的同时，总要有人守住智慧的下限，建立全方位的防护体系，让科技不作恶。

　　本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。

上一篇：王小川的百川智能开源全新医疗增强大模型部署成本降至DeepSeek157开云体育

下一篇：暂无

首页

关于我们

开云体育

产品展示

留言板

咨询研究

联系我们

开云体育NEWS CENTER

国内首开云体育官方个开源大模型安全护栏来啦！DeepSeek服务器“裸奔”主流模型安全堪忧