基于大语言模型的语义保留表情符号推荐
原文中文,约400字,阅读约需1分钟。发表于: 。本研究解决了现有表情符号推荐方法忽视用户文本内容多样性的不足,提出了一个新的语义保留评估框架,以衡量模型推荐的表情符号与用户文本语义的一致性。通过系统性评估六种大语言模型的表现,发现GPT-4o在语义保留评分上表现最佳,达到了79.23%。
EmojiNet是最大的机器可读表情符号意义库,将Unicode表情符号与英文含义相关联。数据集包括语境标签、上下文单词和平台差异。数据集可通过REST API获得。该研究讨论了数据集的开发、质量评估和应用。