将 ContextGPT 的知识融入神经符号活动识别模型
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
人的推理可以理解为直觉、联想的 “系统 1” 和理性、逻辑的 “系统 2” 之间的协作。研究人员提出了一个新的符号系统,利用大型语言模型的进展作为符号的近似,以提高解释性、泛化性和数据效率。通过模糊逻辑计算的规则推理出活动的语义。该方法在广泛的活动理解任务中显示了优越性。
🎯
关键要点
- 人的推理分为直觉的 '系统 1' 和理性的 '系统 2'。
- 整合 '系统 2' 处理对于提高视觉活动理解的解释性、泛化性和数据效率至关重要。
- 构建由符号和规则组成的符号系统可以更好地模拟人类的知识和推理能力。
- 现有方法因手工制作符号和规则的限制,未能涵盖活动的复杂模式。
- 提出的新符号系统具有广覆盖的符号和合理的规则。
- 利用大型语言模型(LLMs)作为符号的近似,以降低手动注释的成本。
- 通过模糊逻辑计算推理活动的语义,方法在活动理解任务中表现优越。
➡️