小红花·文摘

Stack Overflow Blog ·

The Verge ·

本研究探讨了维基数据知识表示中的社会偏见，特别是在链接预测任务中对少数群体的影响。提出的AuditLP框架利用公平性指标识别性别和年龄偏见，发现偏见结果与全球北方和南方的社会经济文化分区相关。

BriefGPT - AI 论文速递 ·

DEV Community ·

本研究旨在提高维基数据中学术数据的可获取性，填补会议数据的不足。通过大型语言模型自动提取会议元数据并进行人工验证，提出了一种新方法，扩展了维基数据中的学术实体，增强了其作为学术资源的实用性。

BriefGPT - AI 论文速递 ·

本研究探讨了Wikidata中的常识知识，发现其与其他常识源重叠较小，并提出了改进建议。同时，研究提出利用大型语言模型和图挖掘技术自动清理Wikidata分类法，评估结果显示其在实体识别任务中有效。

BriefGPT - AI 论文速递 ·

本研究解决了Wikidata分类法中实例与类之间的歧义、分类路径不准确、循环存在及类别冗余等问题。作者提出了一种名为WiKC的新版本分类法，通过结合大型语言模型和图挖掘技术，实现了自动化清理。评估结果显示，WiKC在实体类型识别任务中具有实用价值。

BriefGPT - AI 论文速递 ·

本文探讨了大型语言模型（LLMs）在推理能力上的差异，特别是归纳推理与演绎推理的区别。研究提出了新框架SolverLearner，发现LLMs在归纳推理方面表现优异，但在演绎推理，尤其是“反事实”推理任务中相对不足。这为理解LLMs的推理能力提供了新视角。

BriefGPT - AI 论文速递 ·

本文探讨如何利用Wikidata中的结构化数据生成贫穷语言的开放领域概要，提出了一种神经网络结构，并评估其在阿拉伯语和世界语上的有效性。研究还涉及多语言BERT嵌入和Transformer模型在翻译及序列标记任务中的应用，以提高翻译能力和模型性能。

BriefGPT - AI 论文速递 ·

本文探讨了自然语言处理（NLP）领域的研究，包括利用维基百科和Wikidata进行文化和地理分析、提高数据预测的成本效益，以及通过新方法提取人物生命轨迹。这些研究旨在改善数据的可用性和准确性，推动社会科学研究和政策决策。

BriefGPT - AI 论文速递 ·

ParaNames 是一个多语言个人名库，涵盖 400 种语言和 1.18 亿个人名，支持命名实体识别和机器翻译。经过七年的新闻分析和维基百科挖掘，该库包含 20 万个名字及其变体，旨在改善名称搜索和机器学习。

BriefGPT - AI 论文速递 ·

本文介绍了一个新的数据集，用于在知识图谱上进行口头回答的对话式问答。通过扩展现有的多轮对话式问答数据集，提供了新的贡献，并使用五个序列到序列模型进行了实验，同时保持语法的正确性。进行了误差分析，详细说明了模型在指定类别中的误差率。提议将答案口头化的数据集公开，并详细说明其使用，以便广泛使用。

BriefGPT - AI 论文速递 ·