该研究提出了一种新颖的在线市场谈判对话代理,能够动态调整价格并添加或删除商品,提供更灵活和全面的谈判体验。通过创建 Integrative Negotiation Dataset (IND) 数据集,结合定义谈判意图、行动和意图-行动模拟的方法,生成潜在的对话流。使用 GPT-J 作为提示生成对话,通过人机协作的方式进行后期编辑和修正,以确保数据质量。通过采用针对谈判任务量身定制的一组新颖奖励,训练了名为 Integrative Negotiation Agent (INA) 的谈判代理。通过运用 IND,评估了基于奖励的对话系统在谈判中的有效性。结果表明,所提出的方法和奖励系统显著提升了代理的谈判能力。
完成下面两步后,将自动完成登录并继续当前操作。