本文针对电力系统网络安全面临的复杂威胁,提出了一种基于强化学习的自主渗透测试框架SPIND-DQL。该研究将渗透测试建模为马尔可夫决策过程,通过集成NoisyNet、Dueling架构、优先经验回放、内在好奇心模块和Soft Q-Learning等先进技术,显著提升了攻击路径探索的 ...
本文创新性地提出MA-DQL with GA(多智能体深度Q学习结合遗传算法)框架,通过联合优化多无人机(UAV)轨迹、发射功率和波束成形(beam-forming),显著降低无线传感器网络(WSN)中最大任务完成时间。研究对比传统K-means聚类+蚁群优化(ACO)的基准方法(BM),证明该算法在 ...