LLaMIPa: 增量对话解析器
原文中文,约300字,阅读约需1分钟。发表于: 。该研究提出了首个使用在 SDRT 风格标注的语料库上进行微调的大型语言模型(LLM)进行话语解析实验。结果是一个名为 LLaMIPa(LLaMA 增量解析器)的话语解析器,能够更充分地利用话语背景,相较于只使用编码器模型提供局部、上下文敏感的话语单元表示的方法,取得了显著的性能提升。此外,它能够逐步处理话语数据,这对于将来在下游任务中使用话语信息是必不可少的。
本文提出了一种基于LSTM的多任务模型,用于增量检测口吃结构,并在Switchboard对话行为语料库上进行了训练和测试。结果显示,该模型在SWDA上表现优异,并具有很好的泛化潜力。该研究对于口吃的领域通用处理具有重要意义。