MIT News - Artificial intelligence ·

人工智能错视现象：机器能在无生命物体中识别面孔吗？

💡 原文英文，约1100词，阅读约需4分钟。

📝

内容提要

1994年，佛罗里达珠宝设计师在烤奶酪三明治中发现圣母玛利亚图像，引发对错视现象的研究。MIT团队创建5000张图像数据集，研究人类和机器对错视面孔的感知差异。研究表明，训练算法识别动物面孔能提高对错视面孔的识别，暗示这种能力可能源于进化。研究还提出了错视面孔的最佳复杂度区间，并开发相关模型，有助于改进面部检测系统和产品设计。

🎯

关键要点

1994年，佛罗里达珠宝设计师在烤奶酪三明治中发现圣母玛利亚图像，引发对错视现象的研究。
MIT团队创建了一个包含5000张错视图像的数据集，研究人类和机器对错视面孔的感知差异。
研究发现，训练算法识别动物面孔能显著提高对错视面孔的识别能力，暗示这种能力可能源于进化。
研究提出了错视面孔的最佳复杂度区间，即“金发姑娘区”，在此范围内人类和机器最容易识别面孔。
团队开发了一个方程来建模人类和算法如何检测错视面孔，并验证了“金发姑娘区”的存在。
新数据集“事物中的面孔”规模远超以往研究，允许研究者探索最先进的面部检测算法在错视面孔上的表现。
数据集的构建涉及从LAION-5B数据集中筛选约20000张候选图像，并由人类标注者进行详细标注。
研究有潜在应用于改善面部检测系统，减少误报，影响自动驾驶、人与计算机交互和机器人等领域。
研究者计划将数据集分享给科学界，并考虑未来训练视觉-语言模型以理解和描述错视面孔。
研究引发了关于人类感知与算法解释之间差异的有趣问题，探讨了错视现象的益处与弊端。

❓

延伸问答

什么是错视现象？

错视现象是指在无生命物体中看到面孔或图案的现象。

MIT的研究团队在错视现象方面做了什么？

MIT团队创建了一个包含5000张错视图像的数据集，研究人类和机器对错视面孔的感知差异。

训练算法识别动物面孔有什么影响？

训练算法识别动物面孔能显著提高对错视面孔的识别能力，暗示这种能力可能源于进化。

什么是“金发姑娘区”？

“金发姑娘区”是指一种视觉复杂度的特定范围，在此范围内人类和机器最容易识别面孔。

这个研究对面部检测系统有什么潜在应用？

研究有潜在应用于改善面部检测系统，减少误报，影响自动驾驶和人与计算机交互等领域。

研究者计划如何分享他们的数据集？

研究者计划将数据集分享给科学界，并考虑未来训练视觉-语言模型以理解和描述错视面孔。

🏷️