电影中的视觉物体化:走向视频解读的新 AI 任务

原文约300字,阅读约需1分钟。发表于:

这篇研究论文介绍了一项新颖的视频解释任务,旨在检测电影中的角色物体化现象,通过引入 ObyGaze12 数据集,验证了近期视觉模型的可行性,并展示了任务的挑战以及概念瓶颈模型的应用。

本文通过分析电影镜头中的图像特征,对性骚扰、性虐待和性暴力进行了分类。研究发现面部表情和接触是关键因素。已有的内容检测器无法识别这类图像,因此研究开发了适用于深度学习的数据集。该数据集基于印度电影场景,可用于研究和开发。

相关推荐 去reddit讨论