本研究提出了一种新的上界价值界限,以提升部分可观察马尔可夫决策过程(POMDP)中状态信念价值的计算效率。尽管计算成本较高,但实证评估表明该方法在基准测试中加速了POMDP求解器的性能。
完成下面两步后,将自动完成登录并继续当前操作。