小红花·文摘 - 小红花技术领袖俱乐部

本研究提出了一种新颖的备战棋策略学习方案，结合在线与离线方法，利用并行超级计算机的处理能力，实现了与顶尖玩家相当或更优的表现，推动了备战棋价值函数学习的进展。

Learning and Improving Backgammon Strategy

BriefGPT - AI 论文速递 ·

该文介绍了一种构建置信区间的方法，通过多个随机梯度下降和在线方法实现，避免了现有分批方法中的复杂混合条件，减少计算量。

高效不确定性量化：简易重采样随机梯度下降

BriefGPT - AI 论文速递 ·