INA:一种通过基于奖励的对话系统增强谈判策略的整合方法
原文中文,约600字,阅读约需2分钟。发表于: 。我们提出了一种新颖的用于在线市场的谈判对话代理,该代理具有谈判价格以及添加或删除商品等其他因素的能力,从而提供了更灵活和全面的谈判体验。通过创建 Integrative Negotiation Dataset (IND) 数据集,我们引入了一种新的半自动数据创建方法,结合用户和代理之间的定义谈判意图、行动和意图 - 行动模拟,生成潜在的对话流。使用 GPT-J...
该研究提出了一种新颖的在线市场谈判对话代理,能够动态调整价格并添加或删除商品,提供更灵活和全面的谈判体验。通过创建 Integrative Negotiation Dataset (IND) 数据集,结合定义谈判意图、行动和意图-行动模拟的方法,生成潜在的对话流。使用 GPT-J 作为提示生成对话,通过人机协作的方式进行后期编辑和修正,以确保数据质量。通过采用针对谈判任务量身定制的一组新颖奖励,训练了名为 Integrative Negotiation Agent (INA) 的谈判代理。通过运用 IND,评估了基于奖励的对话系统在谈判中的有效性。结果表明,所提出的方法和奖励系统显著提升了代理的谈判能力。