深信服安全GPT技术应用一文详解

2023-12-04 华体会最新首页地址

深信服首秀安全GPT技术应用，实力刷屏。着极强的好奇心，大家都想深挖深信服安全GPT背后的技术积累。

经过梳理，大家常常提及的有以下9个问题，今天深信服一次性进行详细解答，希望能帮大家全方面了解AI+安全，以及安全GPT技术应用。

生成式大模型的爆火不是一蹴而就的。AI技术经历了从决策式小模型到生成式大模型的发展历程。

最近十年，决策式小模型被大规模应用在电商、娱乐、人脸识别、无人驾驶、文本分析等领域，不知不觉早已在各行各业中司空见惯。今年开始，以ChatGPT为代表的生成式大模型爆火，慢慢涌现出在不一样的行业的技术应用，网络安全亦是其中之一。

顺应技术发展的新趋势，以深信服为例，作为国内最早应用AI的网络安全厂商之一，深信服在2015年开始投入决策式AI技术的研究和应用。2016年，深信服不断加码AI技术并确立了AI First的研发战略，在网络安全和云计算领域都有可落地、有效果的技术突破：

目前深信服在十几个不同的技术领域都用到了人工智能，均取得了良好效果，这些技术大量应用到深信服的产品和用户使用场景中，深受认可。

从AI小模型到提出AI First战略，深信服累积了研发垂直领域AI大模型所需的高质量数据语料、既懂AI又懂安全的人才、面向AI体系化协同的云网端产品体系。

基于这些积累，在2022年明确全面拥抱大模型后，深信服得以在业界首秀安全GPT，为网络安全发展注入新动能。

一方面，GPT大模型的出现，让攻击方可以更便捷快速地生成攻击工具、混淆攻击代码等，针对性地构造未知、高级的攻击。当前安全设备对于这种未知恶意样本查杀能力较弱，非常容易被攻击者绕过。而过去大范围的应用于安全检验测试领域的AI机器学习小模型，每种模型只能用于单一检测场景，小模型训练与研发效率较低，误报率居高不下。

另一方面，在安全运营工作中，人员能力和精力仍然是巨大的瓶颈。即使是专家级别的运营人员，面对高级安全威胁也要花费数小时甚至数天做多元化的分析和研判，同时在某些领域仍会存在能力短板。安全运营效率和效果提升面临较大的发展瓶颈。

深信服认为，面对攻击方使用大模型，防守方能力瓶颈难以突破的情况下，防守方也要充分拥抱大模型，以智能对抗智能，以AI赋能防守，方能应对大模型时代的安全挑战。大模型既有泛化的检验测试能力，也有高质量的攻击解释能力，以及分析态势和处置建议的生成能力，由此能够提升高级威胁检出率、降低误报率（安全告警里判错的比例），极大拉高安全运营团队的能力水位线，促进安全建设效果、效率的提升。

数据、算力、模型算法、产品架构是在网络安全领域玩转GPT大模型的门槛，此外，我们也不可以忽视复合型人才队伍的打造。

作为一家深耕网络安全和云计算的公司，深信服在安全领域应用GPT技术有一些天然优势：

Q4：以GPT为代表的AI技术应用于网络安全，主要带来哪几个方面的增益提效？

网络安全的本质在于攻防对抗。根据Gartner“防御-检测-响应-预测”的新一代自适应安全防御架构，GPT大模型技术应用于网络安全可以从检测、响应、预测三方面切入，最终实现对于威胁的有效防御。

检测：判断文件样本、代码等是否恶意，访问登录、进程通信等是否异常，从而精准识别未知威胁。

响应：实现告警削减、攻击链溯源，以自然语言对话的方式，实现自动化/半自动化响应。

预测：通过大量学习恶意样本、对抗策略，以及挖掘漏洞，真正的完成以攻促防，预测攻击的发生。

深信服安全GPT是完全自主可控的，不应用ChatGPT能力，且由深信服自主训练，训练数据部署在深信服托管云上。

深信服安全GPT以自研模型 SangforLM 为技术基础，吸收业界众多先进的开源大模型优秀实践，不断进化。

基于深信服8年来持续积累的高质量安全语料，深信服安全GPT通过预训练和参数微调等方式，能够深入攻击样本检测、漏洞研判、分析处置等安全细分场景，实现深度理解和专业研判的安全领域垂直大模型。

在推理能力方面，安全GPT以自然语言交互为基础，具备强大的用户场景上下文理解能力。

在事件研判方面，深信服打通了本地系统和产品，安全GPT能够迅速研判安全事件并给出正确结论，联动日志进行溯源分析，并具备准确率极高的流量检测能力。

基于生成式AI的安全GPT在辅助安全运营方面，具备极强的客户的真实需求理解和建议生成能力，可大幅度降低服务和运营人力成本，为安全运营全面助力。

接下来，安全GPT会持续通过高质量安全语料和云网端产品架构的不断喂养和学习，同时在安全专家和小模型的监督调优之下，在安全的所有的领域持续提升能力。

安全GPT对未知攻击的检测，来源于对攻击流量、文件的深度理解能力。经过预训练之后的大语言模型对于代码、文本天然具备较好的理解和生成能力。

深信服利用安全领域的高质量攻击样本对安全GPT进行投喂训练，结合多种大模型微调手段，以及专家、小模型的监督强化，使得安全GPT最终具备对未知攻击的意图理解、异常判定、混淆还原能力。

通过前期5000万样本数据测试，相较传统检测引擎，赋能安全GPT技术的深信服XDR高级威胁检测率高达95.7%，误报率（安全告警里判错的比例）仅4.3%。

用户的自然语言对话请求经过XDR平台，会与用户本地的各类信息，如资产信息、攻击上下文等信息进行关联，送入云端安全GPT进行理解。

安全GPT进一步通过XDR平台与各类安全设备、情报、资产库表进行对接、查询和调查，将查询得到的信息进行理解、转化。

根据不同场景的个性化需求，安全GPT可以用文字、图表等多模交互的关键指标为输出。

Q8：企业里使用GPT技术有一定的数据安全合规要求，对此深信服安全GPT是如何做的？

深信服深耕网络安全多年，坚持网络安全和数据安全的底线。深信服进行大模型训练的数据均为通用安全知识，不涉及任何与用户个人信息相关的数据。

大模型部署推理所需的数据，执行严格匿名化策略，保证数据不标识到具体用户。

深信服XDR作为一个开放的平台，通过原生的流量采集工具与端点采集工具收集关键数据，通过网端聚合分析引擎对数据来进行上下文关联分析，实现攻击链深度溯源。

目前，深信服XDR支持对接自身网和端的安全组件，也支持第三方设施安全数据的对接和应用。XDR平台对接第三方组件后，安全GPT即可通过XDR平台对接第三方组件做多元化的分析响应。

站在用户视角，未来的安全建设，拥抱大模型时代的“AI+安全”，离不开云网端架构的落地：

依托承载AI小模型技术的终端、网络安全组件，配合云端规则库和情报库，针对流量侧和终端侧的文件进行检测。

安全GPT收集平台关联分析的数据，针对复杂攻击和场景，进一步理解、研判，并给出最终处置建议。

最后，为了助力用户“安全领先一步”，我们大家都希望用户立足大模型时代，充分将AI技术方法运用到网络安全领域，出于切身体验，还有以下几点建议：

正确认识AI技术应用：一定要理性评估AI技术的应用手段，并保持对大模型加快速度进行发展的关注。

正确评估建设路线：开放协同是基本要求，可优先考虑以云化方式，与已有安全设备整合，并集成到当前安全业务流。

关注AI引发的风险：谨慎防范数据投喂泄密，以及更广泛的API使用带来的暴露面风险。

2021年，加州理工学院研究人员开发了一种使用功能性超声读取大脑活动的方法，这是一种侵入性小得多的技术。

12月1日晚，我国北方多地出现绚丽极光，让人大饱眼福，但也有人遗憾错过。

相比已经在材料科学领域应用的X射线三维表征技术，透射电镜三维取向重构技术将空间分辨率从微米级提高到纳米级。

近日，上海重磅发布生物医药产业三大行动方案，推动合成生物、基因治疗、医疗机器人三大前沿赛道发展，找好动力源、下好先手棋、释放新动能、培育“核爆点”。

去年，艾超带领团队在玉米茎木质部伤流液内发现了具有固氮能力且高度保守的核心细菌微生物组，增进了人们对玉米和微生物相互关系的理解。

设立于1994年的杰青项目重点支持基础研究优秀人才，五年内给予稳定的经费资助，在科技界广受好评。

12月2日，首届中国国际供应链促进博览会（以下简称“链博会”）在北京闭幕。”“链博会为国际工商界加强产业链供应链交流合作搭建全新开放平台，是全球共享的国际公共产品。

国际人士一致认为，首届链博会具有开创意义，传递出中国将更深层次参与构建全球产业链供应链体系的信号。

工业与信息化部近日印发《2023年5G工厂名录》，遴选产生了300家已建成的5G工厂，覆盖24个国民经济大类。

碳材料家族又添两位新成员：通过对两种分子实施“麻醉”和“手术”，同济大学材料科学与工程学院许维教授团队首次成功合成分别由10个或14个碳原子组成的环型纯碳分子材料。

这项基于中国子午工程拓展的“国际子午圈大科学计划”，将实现对地球空间天气的实时监测和预报，推动人类社会解开更多空间奥秘。

在十一大学科领域的110个热点前沿和18个新兴前沿中，中国研究前沿热度指数排名第一的前沿数为31个，约占1/4。

在“第四次工业革命”的技术浪潮中，中国企业正在全力加码前瞻性布局，储备大量核心技术，助力推动中国人形机器人产业高水平发展。

数字化转型和创新是中小企业高质量发展必答题，惠普与20多万家中小企业组织深入合作，中国市场是惠普打造全球供应链的关键一环。

“三北”工程，是1978年党中央、国务院作出的在我国西北、华北北部和东北西部建设三北防护林体系的重大决策，揭开了我国大规模推进国土绿化和生态治理修复的序幕。

开放数据是开放科学的基本要素，也是支持研究可重复性的关键。30日，施普林格·自然集团联合中国科学院计算机网络信息中心首次对外发布《中国开放数据白皮书2023》。白皮书显示，中国科研群体对开放数据有较高的接受度和支持度，有78%的受访者赞成公开研究数据成为惯例。

2021年11月，中国科学院空天信息创新研究院与合肥市开启战略合作，中科星图将GEOVIS数字地球全球总部项目落地合肥。

浪潮信息高级副总裁刘军说，模型的大小、训练所需参数量的规模等因素直接影响智能涌现的质量。

当癌细胞缺少一种重要蛋白时，能激活免疫系统的“备用机制”来对抗癌细胞。

上一篇: 浅谈互联网相关知识了解互联网的过去与未来

下一篇: 网宿科技：如有重大事项公司会严格依据信披规则的要求及时对外披露

案例展示

深信服安全GPT技术应用一文详解