小红花·文摘 - 小红花技术领袖俱乐部

本研究提出了一种新的框架——认识模糊马尔可夫决策过程（EA-MDP），旨在解决在线决策中的复杂性问题。通过量子测量技术计算奖励函数，验证了在认识模糊情况下存在最优策略和价值函数，实验结果表明代理能够收敛到最优策略。

Quantum-Inspired Reinforcement Learning in the Presence of Epistemic Ambiguity

BriefGPT - AI 论文速递 ·

本研究探讨量子系统状态测量中的不确定性，提出了一种普遍的条件化规则，分析期望性、一致性与无差别的相互作用，结果表明该规则可推广至一组测量结果，从而加深对量子测量的理解。

Indistinguishable Conditioning in Quantum Mechanics

BriefGPT - AI 论文速递 ·