基于不确定性的贝叶斯策略重用方法-系统工程与电子技术2025年02期

基于不确定性的贝叶斯策略重用方法

作者：付可陈浩王宇刘权黄健字体：小中大

打印

摘要：针对多智能体对抗中因对手策略变化导致的非平稳性问题，在对手动作不可获取的限制下，提出一种基于不确定性的贝叶斯策略重用算法。在离线阶段，在策略学习的同时，通过自编码器建模智能体轨迹与对手动作之间的（试读）...

系统工程与电子技术

2025年第02期

期刊目录

基于HLS的高精度位移测量算法的硬件加速设计
基于噪声元学习的卫星遥测信号异常检测方法
基于特征值融合的动态信道化子带检测算法
基于高光谱跨场景迁移学习的集成对齐子空间自适应算法
基于并行计算的PCAL信号相位实时提取系统设计
基于MFFDet R的多源舰船图像融合检测方法
一种伯努利粒子滤波器的FPGA实现
基于启发式频率规划的多雷达波形设计
轻量化的ML SNet雷达复合干扰识别算法
基于图像结构信息的可见光和SAR图像快速配准
基于多目标稳健STAP的集中式MIMO雷达波形设计
基于动态模态分解的弹道目标平动补偿与微动特征提取方法
复杂场景下间歇采样转发干扰抑制算法
基于概率强度偏好的冲突分析图模型方法
基于XGboost和线性回归的军队体系建设 “成本-能力”组合优化模型
基于自适应变邻域搜索的火控雷达组网资源调度研究
基于跨尺度等效弹性的航空装备损修性能评估
基于RF XGBoost算法的无人机多回合攻防博弈决策
地月平动点高轨观测系统设计及效能分析
基于不确定性的贝叶斯策略重用方法
基于结构化数据的区域保障调度模型研究
基于多层编码遗传算法的舰载机群兵力行动规划方法
Dueling DQN优化下的航班延误自适应图卷积循环网络预测方法
基于滑模控制的高升阻比飞行器协同制导方法
弱通信下无人潜航器事件触发一致性协同控制
多智能体系统自适应固定时间编队控制
复合式无人直升机姿态控制半物理仿真验证
基于多项式混沌展开的船舶避碰鲁棒轨迹规划
面向阵列天线抗干扰无人机的隐蔽诱骗方法
基于多尺度融合神经网络的同频同调制单通道盲源分离算法
并行载波索引差分混沌移位键控通信方案
基于新信息准则与梅西算法的LSC DSSS信号序列估计
基于AHP权重优化的数据链跳频网络信道负载统计算法
基于Vondrak Cepek组合滤波和注意力机制加权的时间比对融合算法

泸州市图书馆电子阅览室

基于不确定性的贝叶斯策略重用方法

系统工程与电子技术

2025年第02期

期刊目录

泸州市图书馆电子阅览室

新用户注册

注册成功

修改电子邮件