小红花·文摘

本文探讨了通过结合多种赌博机算法创建主算法，以优化探索与利用的平衡，提升性能。研究提出了元学习框架，改进了多臂赌博机和上下文赌博机的学习效果，并在少样本学习和联邦学习中表现出色。