小红花·文摘

本研究探讨大型语言模型（LLMs）是否能够自我反思其语言知识，尤其是语法和词预测。结果表明，尽管模型在任务中表现良好，但缺乏自我访问能力，这对理解其语言知识提出了新挑战。

Language Models Fail to Introspect About Their Knowledge of Language

BriefGPT - AI 论文速递 ·

本研究提出了一种跨模态知识迁移学习框架（CMKT），有效整合语言知识与语音增强模型，实验结果表明其在多种条件下表现优异。

语言知识迁移学习在语音增强中的应用

BriefGPT - AI 论文速递 ·

本文探讨了现代语言模型（LLMs）中的语言知识及其与模型性能的关系，强调信息论框架的重要性。研究发现，LLMs在生成语法正确文本方面表现优异，但在功能语言能力测试中存在不足。文章还讨论了LLMs与儿童语言习得的关系，并提出改进评估标准的建议，强调了进一步实证研究的必要性。

语言模型作为语言模型

BriefGPT - AI 论文速递 ·

本文研究了大型预训练语言模型中的语言知识及其行为，发现模型在不同语言中的表现存在差异。通过微调可以揭示隐藏的语言知识。评估结果表明，模型规模越大，表现越好，但仍存在偏见和错误。提出了一种新评估框架以量化偏见，并探讨了提示设计对模型性能的影响。此外，研究发现模型存在泄漏风险，可能泄露个人信息，并提出了自检测方法以改善检测性能。

喜欢黄色是否意味着开校车？语言模型中的语义泄露

BriefGPT - AI 论文速递 ·

本研究探讨了神经语音识别模型Wav2Vec2如何感知同化声音及其语言知识的补偿机制。实验结果表明，模型在最后层次将同化声音转变为基本形式，并依赖最少的语音环境线索。这些发现有助于理解神经自动语音识别模型与人类语音处理的相似性和差异性。

神经语音模型中的人类语言偏置: Wav2Vec2.0 中的音位分类和音律限制

BriefGPT - AI 论文速递 ·

CogNet是一个整合了语言知识、世界知识和常识知识的知识库，采用三层统一的框架式表示架构，并通过混合自动标注和众包注释的策略将常识知识与其他结构化知识集成。目前，CogNet包含1000+个语义框架、2000万+个实例和90000+个常识知识断言。用户可以在在线平台上查询和探索，并以RDF格式免费下载使用。

将维基数据分类整合到 YAGO 中

BriefGPT - AI 论文速递 ·