本研究探讨了医疗、机器人和金融领域中因果效应估计的时机和方式。作者提出了一种新颖的深度Q算法EDQ,能够同时估计行动的时机和效果。实验结果表明,该方法在生存时间和肿瘤生长任务上表现优异,具有重要的应用潜力。
完成下面两步后,将自动完成登录并继续当前操作。