小红花·文摘

本研究提出了WinoWhat，一个新的语料库，包含WinoGrande验证集的意译，并评估语言模型在五个常识知识类别上的表现。结果显示，所有模型在WinoWhat上的表现远低于预期，表明对WinoGrande的推理能力评估被高估。

WinoWhat：带有常识分类的 paraphrased WinoGrande 句子的平行语料库

BriefGPT - AI 论文速递 ·

本研究提出了ConceptEdit框架，旨在解决大型语言模型中的常识知识编辑问题。通过整合概念化与实例化，提升模型的常识推理能力。实验结果表明，采用ConceptEdit的模型在常识知识生成和问答测试中优于其他基线模型。

ConceptEdit: Conceptualization-Augmented Knowledge Editing in Large Language Models for Commonsense Reasoning

BriefGPT - AI 论文速递 ·

本文探讨了常识知识的定义及其在自然语言处理中的应用，指出部分基准测试中存在不真实的常识实例，影响模型推理能力的评估。通过整合现有定义，提出了统一的常识知识定义，并在CommonsenseQA和CommonsenseQA 2.0数据集上进行实验，发现模型在常识知识实例上的表现显著低于其他实例。

What is True Commonsense Knowledge?

BriefGPT - AI 论文速递 ·

本研究探讨了Wikidata中的常识知识，发现其与其他常识源重叠较小，并提出了改进建议。同时，研究提出利用大型语言模型和图挖掘技术自动清理Wikidata分类法，评估结果显示其在实体识别任务中有效。

Wikidata中的不相交性违反

BriefGPT - AI 论文速递 ·

本文综述了视觉问答（VQA）任务，比较了传统方法与常识知识的融合，评估了不同数据集的问答对。探讨了未来发展方向，强调结构化知识库与自然语言处理模型的结合，研究了零样本VQA的能力，提出了新模型和策略以提高性能，并探讨了逻辑组合问题的解决方案。

帮助我识别：LLM+VQA系统是否足以识别视觉概念？

BriefGPT - AI 论文速递 ·

本研究分析大型语言模型在生成常识知识时的不足，特别是对日常物体的材料和部件提取能力。结果显示，这些模型在识别物体部件和材料方面的覆盖性和可靠性，为人工智能研究和多步问答提供了有价值的知识。

Large Language Models as Tools for Extracting Object Knowledge

BriefGPT - AI 论文速递 ·

本文提出了一种基于常识知识的因果情感推断方法，通过增强图注意模块提取对话上下文和情感知识，从而提升情感识别性能。研究还分析了多个情感数据集，探讨了情感推断与人类行为的相似性，并强调了常识模型在情感识别中的重要性。

K-Act2Emo：韩语基础知识图谱用于间接情感表达

BriefGPT - AI 论文速递 ·

AI模型使用问答数据集提供定制化问答功能，支持儿童教育应用。引入FairytaleCQA数据集，补充教育适用的常识知识。实验结果显示，微调较小模型使用FairytaleCQA胜过更大的提示工程化语言模型。人类专家的数据注释仍然重要。

童话问答：将常识知识图谱融入儿童故事书叙述

BriefGPT - AI 论文速递 ·

CogNet是一个整合了语言知识、世界知识和常识知识的知识库，采用三层统一的框架式表示架构，并通过混合自动标注和众包注释的策略将常识知识与其他结构化知识集成。目前，CogNet包含1000+个语义框架、2000万+个实例和90000+个常识知识断言。用户可以在在线平台上查询和探索，并以RDF格式免费下载使用。

将维基数据分类整合到 YAGO 中

BriefGPT - AI 论文速递 ·