基于Actor-Critic优化的目标识别
📝
内容提要
本研究解决了现有目标识别方法过于依赖手动设计领域和离散表示的问题。提出的深度识别方法(DRACO)基于深度强化学习,首次从非结构化数据中学习策略网络并用于推理,同时引入了新的评估目标假设的连续策略表示度量。DRACO在离散设置中实现了最先进的目标识别性能,并在更具挑战性的连续设置中也表现优越,显著降低了计算和内存成本。
🏷️
标签
➡️