小红花·文摘

本研究提出了一种少样本元离线强化学习算法，旨在解决现有强化学习在安全性和成本上的在线交互依赖问题。该算法利用静态离线数据集进行训练，能够有效扩展到新环境，优化无人机轨迹和调度策略，实现快速收敛，并达到最佳的年龄信息和传输功率平衡。

BriefGPT - AI 论文速递 ·

本文介绍了一种基于强化学习的联邦学习框架，结合容器化技术和Kubernetes进行客户端部署，提升系统的稳定性和安全性。研究提出个性化的联邦深度强化学习算法，优化无人机轨迹，改善服务质量。同时，动态客户端选择和数据质量感知算法显著提高了训练性能，解决了联邦学习的效率问题。

BriefGPT - AI 论文速递 ·