大家读完觉得有帮助记得关注和点赞!!!
摘要
现代网络攻击日益复杂,对经典的机器学习方法构成了重大挑战,尤其是在标记数据有限且特征交互具有高度非线性的情况下。本研究调查了混合量子-经典学习在增强入侵检测特征表示方面的潜力,并探索了在网络安全分析中可能存在的量子优势。使用UNSW-NB15数据集,通过网络流量经过经典的预处理和归一化转化为结构化的特征向量。在完整数据集上评估了经典模型(包括逻辑回归和具有线性及RBF核的支持向量机),以建立在大样本条件下的基线性能。同时,一个量子增强的流程通过角度编码和纠缠层将经典特征映射到变分量子电路中,该流程在基于CPU的量子模拟器上执行,生成的量子嵌入使用经典的SVM进行分类。实验表明,虽然经典模型在使用大数据集时实现了更高的整体准确率,但在数据稀缺时,量子增强的表示显示出更优的攻击召回率和改进的类间分离性,这表明量子特征空间捕获了浅层经典模型无法获取的复杂相关性。这些结果突显了量子嵌入在改善网络安全任务中的泛化能力和表示质量方面的潜力,并提供了一个可复现的框架,用于评估随着量子硬件和模拟器的不断进步而可能出现的量子优势。
关键词: 网络安全,量子人工智能,混合模型,攻击路径分析,量子机器学习,图学习,量子特征空间,变分量子电路
I 引言
现代网络威胁环境的特点是快速发展和日益复杂,对防御性安全范式构成了艰巨挑战。当代组织网络是高度相互依赖的系统,一个漏洞可能蔓延到各种渠道,形成复杂的攻击链,难以借助传统分析软件进行预测和消除 [CHAWLA20232191]。攻击图分析已成为对此类可能利用序列进行建模的基本方法,其中网络状态和转换被建模为图结构,节点代表系统组件,边代表潜在的攻击行为 [APOLLONI1989233]。图安全分析的经典计算方法在现代攻击面的复杂性以及高级持续性威胁的隐蔽和动态趋势方面存在固有的局限性,尽管它们已经取得了显著进展。
量子计算带来了计算理论的范式转变,有望为特定类型的问题提供加速,这些问题被认为在经典计算上是难以处理的 [Pre]。在网络安全的量子工具正被寻求用于多种应用,例如密码分析、加密流量检测和改进的入侵检测系统 [Movassagh]。量子机器学习利用叠加和纠缠等特殊量子力学效应,可能以全新的方式支持信息处理 [Biamonte2017QML]。早期研究显示出有希望的结果,例如量子支持向量机在恶意软件分类中实现高准确率 [Xiong:2024gld],以及量子集成模型有效识别恶意代码 [Wu_2021]。然而,应用于攻击路径分析的量子增强学习研究在很大程度上仍未探索,因此在量子计算和网络安全分析的交叉领域存在显著的研究空白。
本文填补了量子计算与网络安全分析接口处的一个主要研究空白,即正式地将量子增强学习应用于攻击路径分析的背景之下。据观察,经典的图学习算法是实用的,但无法处理复杂的非线性关系模式,以及真实攻击者-防御者场景中攻击图状态规模的指数级增长 [Fahim]。能够在指数维度的希尔伯特空间上对信息进行建模的量子特征空间概念是一个理论概念,它使得能够以更有效的方式描述此类复杂模式 [Schuld:2018uel]。然而,它们尚未经过实证验证以实现在资源受限环境中的实际应用,特别是在更广泛研究界可达的环境中。
本研究要解决的主要研究问题是:
混合量子-经典模型在攻击路径分析中,尤其是在训练数据有限的情况下,能否显著优于纯经典方法? 我们的假设是,量子特征嵌入在应用于攻击图分类任务以及现实网络安全过程中常见的贫数据环境时,具有高类间分离性和更好泛化能力。
为验证这一假设,我们创建并执行了一个五步混合架构,并在UNSW-NB15数据集 [moustafa2015unsw] 上进行了评估。该数据集是一个广泛采用的网络入侵检测基准,包含约250万个包含正常流量和攻击流量的网络流。我们的方法将经典的图预处理与量子特征映射相结合,采用角度编码和变分量子电路将经典特征转换为量子表示。然后将这些量子嵌入与经典机器学习分类器(支持向量机)结合用于攻击分类,并在数据丰富和数据稀缺条件下与经典基线(逻辑回归、线性SVM、RBF SVM)进行比较评估。
我们发现,尽管经典模型在处理大量训练数据时相对稳健(这些模型在完整UNSW-NB15数据集上的准确率约为69%),但量子嵌入即使在样本量严重受限(200个实例)的情况下也表现出对攻击模式有前景的敏感性。具体而言,量子增强模型在低数据条件下对攻击类别实现了完美的召回率(100%),尽管在良性类别检测上存在权衡。这些结果表明量子特征空间在攻击敏感任务上具有表示优势,同时也指出了在电路表达能力和类别平衡方面存在的、需要进一步优化的现有局限性。
这项工作的关键贡献总结如下:
-
一种创新的、可扩展的方案,用于将基于图的网络安全数据编码为量子表示以分析攻击路径。
-
在攻击图分类上,对量子图核与变分量子电路进行了实证比较。
-
严格分析了量子增强在何种场景下能提供优于经典方法的切实优势。
-
利用免费层量子模拟工具的实践实施指南,以提高更广泛研究界的可及性。
本文的其余部分结构如下:第二部分提供全面的文献综述。第三部分详述所提出的方法和算法工作流程。第四部分展示实验结果和分析。第五部分讨论局限性并概述未来研究方向。最后,第六部分总结全文。
II 文献综述
传统的网络安全分析的发展经历了从简单的基于签名的检测到能够检测新型和零日威胁的高级机器学习算法。基于图的方法因其能够表示网络结构和攻击序列固有的关系数据而变得重要 [Wu_2021, yulie]。基于图神经网络和结构指标的方法现已广泛用于解决安全问题,包括检测MITRE ATT&CK框架中的攻击战术 [gao, zhang]。这些技术依赖于图论属性,如中心性度量和路径统计,来描述网络实体的结构功能和关系。
在特定的攻击路径分析领域,传统方法倾向于构建详细的攻击图,列出所有可能导致关键资产受损的潜在利用序列 [kordy]。然后使用路径查找算法、概率模型或基于机器学习的分类器来分析这些图,并估计网络内最可能产生重大影响的漏洞,并预测攻击者的行为 [Pool]。虽然对中等规模的网络有用,但随着网络规模和复杂性的增加,这些方法容易遇到严重的扩展性问题,状态空间呈指数级增长 [ou2006scalable]。此外,它们无法检测可能隐藏的、表征复杂的、多层攻击迹象的非线性模式 [milajerdi2019holmes]。
经典图分析的这些局限性引发了对可能具有处理复杂关系数据计算优势的量子增强方法的兴趣。新兴研究表明量子技术应用于核心网络安全任务,例如用于入侵检测的混合量子-经典自编码器显示出改进的泛化能力 [rasyidi2025hybrid],以及用于加密流量中威胁检测的量子神经网络 [butt2024quantum]。特别是在图结构问题中,量子方法显示出特殊前景,有框架采用图嵌入量子电路进行漏洞检测 [zhou2022new],以及用于分析复杂攻击模式(如DDoS)的量子增强表示学习 [Biamonte2017QML]。这种融合催生了量子图学习,它通过量子图核和针对图任务优化的变分算法,将量子机器学习与图分析相结合 [schuld2021machine, herman2023quantum]。
然而,将量子图学习应用于网络安全特定的图问题仍然很大程度上未被探索。当前研究主要集中于通用图分类基准,而非攻击图或欺诈网络等安全相关的结构 [bharti2022noisy]。大多数研究也在理想的模拟环境中进行,忽略了实际约束,包括量子噪声、有限的量子比特相干时间以及与现有经典安全基础设施的集成挑战 [franco2024predominant, sai2025quantum]。这一研究空白尤其重要,考虑到网络威胁日益复杂化以及量子计算在分析表征现代多阶段攻击的复杂关系模式方面的潜在优势,这显然需要搭建起量子图学习与现实世界网络安全分析之间桥梁的研究。
III 方法
所提出的方法组织为五个主要阶段:基于特征的图抽象、经典特征处理、量子编码、混合模型训练和评估。总体目标是评估量子增强表示是否在小数据约束和免费层计算环境下为网络安全攻击检测提供了改进的判别能力。整体架构包含五个相互连接的阶段,如图1所示。

图1: 用于网络安全攻击路径分析的经典与混合量子-经典工作流程比较。
III.1 算法工作流程
混合量子-经典攻击路径分析流程通过算法1实现。该算法概述了从图抽象到混合分类的逐步过程。
算法1 混合量子-经典入侵检测流程
输入: 网络流数据集 𝒟, 特征集 ℱ, 量子电路深度 d, 量子比特数 n
输出: 预测的攻击/良性标签及评估指标
⊳ 步骤1:网络安全图抽象
for 每个在 𝒟 中的流记录 do
将该流解释为网络实体间的交互
将选定的特征视为潜在图关系的代理
⊳ 步骤2:经典特征预处理
使用标签编码对分类特征进行编码
使用最小-最大缩放对数值特征进行归一化
构建特征向量 𝐱 ∈ ℝ^n
⊳ 步骤3:量子编码
for i ← 1 to n do
应用角度编码 x_i → R_Y(θ_i)
构建一个深度为 d 的变分量子电路
测量泡利-Z 期望值以获得量子嵌入 𝐪
⊳ 步骤4:混合量子-经典分类
使用 𝐪 训练一个经典SVM
return 预测的标签和性能指标
III.2 网络安全图抽象
尽管原始数据集由网络流记录组成,但该问题是从图学习的角度进行概念化的。每个观测可以被解释为一个局部化的交互图 G=(V, E),其中:
-
节点 (V) 表示:主机(源/目的地)、服务和协议、连接状态。
-
边 (E) 表示:网络通信、流之间的时间或逻辑依赖关系。
我们没有显式地构建完整的攻击图(这对于大规模数据集在计算上是昂贵的),而是采用了一种基于特征的图抽象,其中结构级和流级别的属性近似了局部图行为。这种设计选择允许扩展到真实数据集,同时保留与攻击路径分析相关的图语义。
III.3 经典特征提取与预处理
实验使用UNSW-NB15数据集 [moustafa2015unsw] 进行,这是一个广泛采用的用于网络入侵检测的现实世界基准,捕捉了现代攻击行为和正常流量模式。该数据集包含从原始网络流量中提取的数值型和分类型流级别属性的异构混合。考虑到近期量子模拟带来的约束,特别是可用量子比特数量的限制和量子态空间的指数缩放,精心挑选了一个特征子集以平衡描述能力、可解释性和量子可行性。所选特征集包含八个流级别属性:dur(流持续时间)、proto(传输协议)、service(应用层服务)、state(连接状态)、spkts和dpkts(发送和接收的数据包数量)、以及sbytes和dbytes(发送和接收的字节数)。这些特征共同捕捉了时间特性、协议语义、连接动态和流量体积不对称性,已知这些对于区分良性行为和恶意活动具有高信息量。重要的是,将特征维度限制为八个确保了在后续编码阶段中经典特征与量子比特之间直接的——对应关系。分类属性(proto、service和state)使用标签编码转换为数值表示。为确保训练和测试阶段的一致性并防止未见类别错误,编码器在转换前在训练和测试样本的联合集上进行了拟合。虽然标签编码不保留类别之间的语义距离,但它提供了一种紧凑且确定性的映射,与经典分类器和量子角度编码(其中每个特征值直接参数化一个旋转门)都兼容。在分类编码之后,所有特征使用最小-最大缩放进行归一化,将值映射到[0,1]区间。此归一化步骤对于量子处理至关重要,因为角度编码对输入幅度高度敏感;未缩放的特征可能导致过大的旋转角度,从而引发不稳定的量子态和降低的表示保真度。从经典角度来看,归一化也提高了基于间隔的模型(如支持向量机和逻辑回归)的数值稳定性和收敛行为。
III.4 量子编码策略
量子特征映射 经典特征向量 𝐱 = (x_1, …, x_n) 使用角度编码映射到量子态上,其中每个特征控制一个参数化的单量子比特旋转:
x_i ⟶ R_Y(θ_i). (1)
这种编码确保了:
-
特征数量的线性可扩展性
-
与硬件无关的实现
-
与近期量子设备的兼容性
变分量子电路 (VQC):采用一个变分量子电路作为量子嵌入层:
-
量子比特数:等于特征维度 (8)
-
纠缠策略:StronglyEntanglingLayers
-
深度:2 层
-
测量:泡利-Z 算子的期望值
该电路输出一个量子嵌入向量,作为通过量子操作学习的中间表示。所有电路均使用PennyLane的default.qubit模拟器执行,确保在仅CPU环境下的完全可复现性。
III.5 混合模型训练协议
量子电路充当非线性特征变换层,其后是经典机器学习分类器。
经典模型 以下经典基线在完整数据集上训练:
-
逻辑回归
-
线性支持向量机
-
RBF核SVM(由于计算限制进行了下采样)
量子-经典混合模型 对于量子流程:
-
经典特征 → 量子嵌入 (VQC)
-
量子嵌入 → 经典SVM分类器
由于量子模拟成本,量子模型在200个样本的受控子集上进行了评估,以便与在相同子集上训练的经典模型进行公平比较。
III.6 数据集与实验配置
实验使用UNSW-NB15数据集进行,这是一个广泛采用的入侵检测基准,在受控环境中捕捉了现代网络流量和多样化的攻击行为。该数据集包含约257,000个网络流记录,标记为两类:良性流量和攻击流量。在所有实验中一致保持此二元分类设置,以确保性能评估的清晰度以及不同学习方法之间的可比性。数据集按照标准的UNSW-NB15划分分为训练集和测试集,得到175,341个样本用于训练,82,332个样本用于测试。此划分用于所有全规模的经典实验。为在基于CPU的模拟约束下实现量子实验,从数据集中提取了一个200个样本的缩减子集,并按80%训练和20%测试进行划分,得到160个训练样本和40个测试样本。相同的子集和划分策略一致应用于所有量子和缩减规模的经典实验,以确保公平比较。分类属性使用标签编码,编码器在训练和测试数据上联合拟合,以避免推理期间出现未见类别问题。所有选定的特征使用最小-最大缩放进行归一化,将值映射到有界的数值范围,确保所有实验配置下的数值稳定性和一致的输入缩放。此数据集配置使得能够评估模型在大规模和小数据设置下的行为,支持对经典和量子增强方法的性能趋势进行受控分析。
表1:数据集特征
|
数据集 |
UNSW-NB15 |
|
总样本数 |
~257,000 |
|
使用的特征 |
8 |
|
类别 |
二元 (良性 / 攻击) |
|
量子子集大小 |
200 个样本 |
|
训练/测试划分 |
80% / 20% |
III.7 评估指标
使用一套全面的分类和诊断指标评估模型,以确保性能评估的鲁棒性和可解释性。使用准确率来衡量正确分类样本的总体比例,提供模型在整个数据集上有效性的高层视图。分析精确率和召回率以更好地理解类别特异性行为,这在网络安全背景下尤其重要,因为假阳性和假阴性具有不同的操作影响;精确率量化了攻击预测的可靠性,而召回率捕捉了模型检测恶意活动的能力。F1分数作为一个平衡指标被纳入,它调和了精确率和召回率,在类别不平衡条件下提供更具信息量的评估。此外,检查混淆矩阵以显式可视化误分类模式,从而更深入地了解每个模型如何混淆良性和攻击样本。评估的主要焦点放在经典和量子特征变换所实现的表示质量和类间分离性上,而非计算速度或训练效率,目标是了解量子嵌入是否能够增强判别能力,特别是在小样本和高维网络安全场景中。
IV 结果与分析
图4所示的实验结果系统比较了在完整UNSW-NB15数据集上训练的经典机器学习模型、在与量子学习相同的小样本环境下训练的经典模型,以及基于变分量子嵌入的混合量子-经典模型。该分析旨在隔离表示学习的效果,以便与计算规模进行比较,从而对类间分离性、泛化行为以及小数据下的鲁棒性进行公平比较。通过逐步减小数据集大小和使用基于量子的特征变化,该研究说明了性能趋势如何从数据丰富的经典学习转变为表示质量成为主导因素的数据稀缺状态。
IV.1 完整数据集 – 经典模型

图2: 经典机器学习模型在UNSW-NB15数据集上准确率、精确率、召回率和F1分数方面的性能比较。逻辑回归、线性SVM和RBF SVM观察到类似的结果,基于SVM的模型获得了更高的召回率和F1分数。
在完整数据集上训练的经典模型(逻辑回归、线性SVM和RBF SVM)给出了非常相似的结果,准确率大约在69%左右,如表2所示。这三种模型对攻击类型实现了非常高的召回率(约97-98%),表明对恶意流量具有高敏感性,但对良性类型的召回率非常低(约33-34%),它们偏向于预测为攻击。由此产生的F1不平衡也导致了中等的F1分数,表明在规模上,所选特征集是高度线性可分的,但更偏向于攻击检测而非良性分类。线性和非线性SVM之间的相对差异进一步表明,在这种特征表示和数据集规模下,非线性决策边界相比线性边界提供的额外价值不大。
表2:经典机器学习模型在UNSW-NB15数据集上的分类准确率
|
逻辑回归 |
68.8 |
|
线性SVM |
69.1 |
|
RBF SVM |
68.9 |
IV.2 小样本 (200个样本)
表3:经典模型与基于量子的模型准确率比较
|
逻辑回归 |
72.5 |
|
线性SVM |
80.0 |
|
RBF SVM |
80.0 |
|
量子嵌入 + SVM |
64.0 |
为了与量子方法进行合理比较,使用相同的小样本集(200个样本,160个训练,40个测试)重新测试了经典模型。在这种受限状态下,性能表现出更高程度的可变性。表3显示了经典模型和基于量子的模型之间的准确率比较。逻辑回归的准确率为72.5%,但完全无法找到所有良性样本,这表明其对类别不平衡和小数据量敏感。相反,线性SVM和RBF SVM的准确率均为80%,在两个类别的精确率和召回率平衡方面有显著改善。这些发现表明,在训练数据量有限的情况下,使用基于间隔的分类器比线性概率模型更鲁棒,但性能仍受代表性样本存在的影响。
IV.3 量子 vs 经典 — 受控比较
量子嵌入加SVM模型在相同的200个样本约束下进行了评估,提供了在低数据场景下与经典基线的直接比较。该量子模型的准确率为64%,对攻击类型实现了完美的召回率(100%),但始终未能检测到良性样本,因此其宏平均F1分数为0.39,如表4和图3所示。该表以类别级别的精确率、召回率、F1分数和支持度的形式报告结果,图表用于对指标总体趋势和类别级别预测行为进行可视化评估。相比之下,图4中的混淆矩阵说明了类别级别的预测行为,清楚地显示所有良性样本被误分类为攻击,而所有攻击样本被正确检测。

图3: 量子ML-SVM模型在准确率、精确率、召回率和F1分数方面的定量性能评估。

图4: 模型预测与真实标签的混淆矩阵(量子SVM分类)。
表4:量子嵌入 + SVM 分类性能 (200个样本)
|
良性 |
0.00 |
0.00 |
0.00 |
72 |
|
攻击 |
0.64 |
1.00 |
0.78 |
128 |
|
准确率 |
0.64 |
|||
|
宏平均 |
0.32 |
0.50 |
0.39 |
200 |
|
加权平均 |
0.41 |
0.64 |
0.50 |
200 |
虽然此性能低于最佳经典SVM,但它揭示了一个重要的定性见解:量子嵌入即使使用极少量数据也能强烈分离攻击模式,这表明量子特征映射强调了输入空间中与攻击相关的主导结构。这种行为表明具有高表示敏感性但跨类别的泛化能力有限,可能是由于浅层电路深度、有限的量子比特数以及缺乏可训练的量子参数所致。重要的是,这些结果将量子嵌入定位为现阶段经典模型的替代品,而是作为有前景的表示层,其表达能力可以通过更深的电路、优化的变分训练和噪声感知正则化来显著增强,尤其是在小数据网络安全背景下。
V 局限性与未来研究
尽管从混合量子-经典建模中获得了有前景的见解,但必须承认几个局限性。虽然经典模型是在约257,000个样本的完整UNSW-NB15数据集上进行训练和评估的,但由于当前的量子模拟成本和量子比特可扩展性限制,量子实验被限制在一个小得多的200个样本子集上,这使得直接的性能比较是指示性的而非决定性的。缩减的量子子集也表现出类别不平衡,导致有偏的决策边界,如在量子嵌入+SVM结果中观察到的,对攻击类别实现了完美召回率,但以良性类别零召回率为代价,这突显了量子嵌入对有限和不平衡数据的敏感性。此外,采用的变分量子电路使用浅层深度和有限数量的量子比特以确保在免费层模拟器上的可行性,这限制了量子特征空间的表达能力,并限制了其捕获网络安全数据中存在的复杂非线性关系的能力。所有量子实验都是使用PennyLane的default.qubit模拟器进行的,而非真实的量子硬件,这意味着未考虑硬件特定的效应,如门噪声、退相干和读出错误,这些可能会显著影响实际性能。此外,本研究侧重于表示质量和分类行为,而非计算速度或量子优势,因此不能声称相对于经典方法具有量子加速或效率优势。未来的研究应侧重于随着模拟器和硬件的改进而扩展量子数据集和电路,实现在更大数据子集上训练的更深、更具表达力的电路,以及将评估扩展到噪声感知模拟器和真实量子设备,以评估在现实执行条件下的鲁棒性。探索替代的量子编码策略,如幅度编码、数据重新上传和更具表达力的量子核,可能会进一步改善特征利用率和类间分离性。而改进的类别平衡策略,包括分层抽样和成本敏感学习,可以减轻小数据集中的有偏预测。此外,更丰富的图表示,如量子游走或基于邻接矩阵的编码,可以实现图结构与量子处理之间更紧密的集成。在额外的网络安全数据集和真实企业网络日志上评估所提出的混合方法,将有助于评估超越UNSW-NB15和合成攻击图场景的泛化能力。
VI 结论
本文介绍了一种用于网络安全的混合量子-经典攻击路径分析方法,表明量子增强的图学习可用于在数据稀缺环境中增强攻击模式的分离性。我们在UNSW-NB15上进行的实验表明,虽然经典模型(尤其是SVM)在数据充足时仍然表现良好,但量子嵌入即使仅考虑200个训练数据样本也对攻击模式更敏感。量子方法能够完美召回攻击类别,尽管在良性样本上的准确率有所妥协,这一结果指示了量子特征表示的潜力以及现存的约束。
这项工作的贡献有三方面。首先,我们提供了一个可复现的流程,将经典的图预处理与量子编码策略相结合,并利用当前可用的模拟工具(PennyLane)。其次,我们的实证分析提供了变分量子电路与经典基线在攻击图分类方面的直接比较。第三,我们指出了实践考量,包括电路深度限制、量子比特限制和类别不平衡效应,这些为未来的实施提供了信息。
这些发现验证了量子图学习作为未来网络安全分析资源的潜力,特别是在低数据状态下的异常检测方面。随着当前NISQ及以后量子硬件的兴起,这项工作有潜力为创建可扩展的量子增强安全工具奠定基础,以应对日益复杂的多阶段安全攻击。下一代的研究应侧重于更详细的量子电路、噪声敏感的实现以及在各种安全样本上进行测试,以实现量子AI在主动网络防御方面的全部潜力。
网硕互联帮助中心




评论前必须登录!
注册