小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究探讨了在多模态表情包中检测和缓解仇恨内容的挑战,提出了一种基于提示的技术,开发了UnHateMeme框架,通过替换仇恨文本和视觉元素,有效转变仇恨表情包,提升网络环境的安全性和尊重性。

Detecting and Mitigating Hateful Content in Multimodal Memes Using Vision-Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-30T00:00:00Z

自动生成对抗言论可以有效减少社交媒体上的仇恨内容,但需考虑话题和受众。我们提出基于话语理论的新框架,研究对抗言论与仇恨评论的关系。通过Reddit数据和3.9k评论对的手动注释,识别仇恨和对抗言论,并重新表述以减少冒犯。结果表明,大型语言模型能生成有效的对抗言论,改善模型问题。

CrowdCounter:一种基准类型特定的多目标反言语 dataset

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-02T00:00:00Z

该研究提出了一种新的方法来检测表情包中的仇恨内容,通过使用对比表情包生成器、定制的数据集和图像-文本对齐模块,实现了更准确的仇恨内容识别与分割。实验证明,该方法性能优于现有模型,并具有更少的可训练参数,为仇恨内容的识别和隔离提供了有效机制。

HateSieve:一个用于检测和分割多模态表情包中仇恨内容的对比学习框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-11T00:00:00Z

自动对抗言论生成是打击社交媒体仇恨内容的有效方法。研究提出了基于话语理论的新框架,通过推理链接将对抗言论与仇恨评论连接起来。利用Reddit评论数据集验证了该框架的有效性。该方法可作为应对话语不可知模型故障的保护措施。

无法辨别使用和提及的 NLP 系统对反言进行审查,但教授这种区别有助于

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-02T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码