本研究提出了SPlanner规划模块,利用扩展有限状态机高效建模移动应用控制逻辑,将用户指令分解为可执行路径,从而显著提高任务成功率和执行效果。
本研究解决了语言建模中规划模块与语言模型无法共同微调的问题。通过使用预测标签概率作为混合权重的方法,实现共同训练,优化标签分布。实验结果显示,该方法在困惑度上有明显改善。
价值迭代网络(VIN)是一个全可微神经网络,内嵌有规划模块,可以学习规划和预测基于规划的推理。VIN策略通过学习显式规划计算,能够更好地推广到新的、未见过的域。
完成下面两步后,将自动完成登录并继续当前操作。