本研究探讨了多目标马尔可夫决策中的期望收益向量实现问题,提出通过混合有限纯策略精确逼近任意期望收益向量,并在所有策略下完全实现期望收益,对随机策略设计具有重要意义。
完成下面两步后,将自动完成登录并继续当前操作。