本研究在多臂赌博机环境中,通过知识传递提升在线多任务学习性能。提出了一种TS算法,经验分析显示其接近最优。在合成数据评估中,该算法优于基准和UCB算法。
本研究提出了一种在线多任务学习(OMTL)方法,通过按顺序处理数据预测任务标签并学习任务权重和相互关系。通过引入三种规则来更新任务相互关系矩阵,OMTL方法在三个数据集上的性能评估表明,在EEG数据上准确率提高了1%至3%,并在垃圾邮件数据集上保持了约12%的低错误率。
该论文介绍了两种新颖的在线多任务学习回归问题的方法,分别基于高性能的基于图的多任务学习和基于加权递归最小二乘法(WRLS)和在线稀疏最小二乘支持向量回归(OSLSSVR)的递归版本。通过任务堆叠变换,我们证明存在一个单一矩阵,其中包含多个任务的关系,并提供结构信息供 MT-WRLS 方法在其初始化过程中和 MT-OSLSSVR 的多任务核函数中体现。与现有的以在线梯度下降(OGD)或不精确立方方法为主的文献形成对比,我们实现了在输入空间维度(MT-WRLS)或实例字典大小(MT-OSLSSVR)上具有二次每实例成本的精确和近似递归。我们通过一个真实的风速预测案例研究将我们的在线多任务学习方法与其他竞争者进行比较,证明了两种提出的方法在性能上的显著收益。
完成下面两步后,将自动完成登录并继续当前操作。