大型语言模型是否理解对话言外之意 —— 以中国情景喜剧为例研究
原文中文,约500字,阅读约需2分钟。发表于: 。大规模语言模型的非字面含义对于其成为类似人类的社交交流者至关重要。本文首次介绍了源自中国情景喜剧《武林外传》对话的 Chinese multi-turn-dialogue-based 数据集 SwordsmanImp。我们测试了八种封闭源和开源 LLM 模型在两个任务中的表现:多项选择问题任务和蕴涵说明任务。我们的结果表明 GPT-4...
研究比较了ChatGPT和人类对话的语言差异,发现人类对话在可变性和真实性方面更出色,而ChatGPT在社交过程、分析风格、认知、注意力焦点和积极情绪方面表现优异。研究还提供了一个新的ChatGPT生成的对话数据集,用于语言建模的AI研究。这些结果有助于理解ChatGPT的语言能力,并为区分人类和AI生成的文本提供了信息。