使用策略蒸馏和行动伪造的可解释性深度强化学习模型在华法林维持剂量上的应用
📝
内容提要
利用深度强化学习设计了一个可解释的华法林剂量方案,该方案采用了近端策略优化方法结合策略蒸馏,并引入了 Action Forging 作为一种有效工具,研究结果显示该模型易于理解和部署,并且优于基线剂量算法。
🏷️
标签
➡️