GOAT-Bench: 多模态大型模型的安全洞察力通过基于模因的社交滥用
原文中文,约2700字,阅读约需7分钟。发表于: 。社交媒体的指数增长深刻改变了信息的创造、传播和吸收方式,在数字时代超过以往任何时候。遗憾的是,这种爆炸也引发了网络违规使用表情包的显著增加。针对包括隐性仇恨言论、性别歧视和网络欺凌等主题的超过 6k 个多样表情包,本文全面研究了各种大型多模型(LMMs)(如 GPT-4V)识别和应对表情包中微妙方面的社交虐待的能力。我们引入了全面的 GOAT-Bench 表情包基准,并利用...
社交媒体的指数增长改变了信息的创造、传播和吸收方式,但也导致了网络违规使用表情包的增加。本文研究了大型多模型识别和应对表情包中的社交虐待能力,并提出了GOAT-Bench表情包基准。实验结果显示当前模型对隐性虐待形式缺乏敏感性。