小红花·文摘

本研究探讨了在多模态表情包中检测和缓解仇恨内容的挑战，提出了一种基于提示的技术，开发了UnHateMeme框架，通过替换仇恨文本和视觉元素，有效转变仇恨表情包，提升网络环境的安全性和尊重性。

BriefGPT - AI 论文速递 ·

自动生成对抗言论可以有效减少社交媒体上的仇恨内容，但需考虑话题和受众。我们提出基于话语理论的新框架，研究对抗言论与仇恨评论的关系。通过Reddit数据和3.9k评论对的手动注释，识别仇恨和对抗言论，并重新表述以减少冒犯。结果表明，大型语言模型能生成有效的对抗言论，改善模型问题。

BriefGPT - AI 论文速递 ·

该研究提出了一种新的方法来检测表情包中的仇恨内容，通过使用对比表情包生成器、定制的数据集和图像-文本对齐模块，实现了更准确的仇恨内容识别与分割。实验证明，该方法性能优于现有模型，并具有更少的可训练参数，为仇恨内容的识别和隔离提供了有效机制。

BriefGPT - AI 论文速递 ·

自动对抗言论生成是打击社交媒体仇恨内容的有效方法。研究提出了基于话语理论的新框架，通过推理链接将对抗言论与仇恨评论连接起来。利用Reddit评论数据集验证了该框架的有效性。该方法可作为应对话语不可知模型故障的保护措施。

BriefGPT - AI 论文速递 ·