本研究探讨大型语言模型(LLMs)是否能够自我反思其语言知识,尤其是语法和词预测。结果表明,尽管模型在任务中表现良好,但缺乏自我访问能力,这对理解其语言知识提出了新挑战。
本研究提出了一种跨模态知识迁移学习框架(CMKT),有效整合语言知识与语音增强模型,实验结果表明其在多种条件下表现优异。
本文探讨了现代语言模型(LLMs)中的语言知识及其与模型性能的关系,强调信息论框架的重要性。研究发现,LLMs在生成语法正确文本方面表现优异,但在功能语言能力测试中存在不足。文章还讨论了LLMs与儿童语言习得的关系,并提出改进评估标准的建议,强调了进一步实证研究的必要性。
本文研究了大型预训练语言模型中的语言知识及其行为,发现模型在不同语言中的表现存在差异。通过微调可以揭示隐藏的语言知识。评估结果表明,模型规模越大,表现越好,但仍存在偏见和错误。提出了一种新评估框架以量化偏见,并探讨了提示设计对模型性能的影响。此外,研究发现模型存在泄漏风险,可能泄露个人信息,并提出了自检测方法以改善检测性能。
本研究探讨了神经语音识别模型Wav2Vec2如何感知同化声音及其语言知识的补偿机制。实验结果表明,模型在最后层次将同化声音转变为基本形式,并依赖最少的语音环境线索。这些发现有助于理解神经自动语音识别模型与人类语音处理的相似性和差异性。
CogNet是一个整合了语言知识、世界知识和常识知识的知识库,采用三层统一的框架式表示架构,并通过混合自动标注和众包注释的策略将常识知识与其他结构化知识集成。目前,CogNet包含1000+个语义框架、2000万+个实例和90000+个常识知识断言。用户可以在在线平台上查询和探索,并以RDF格式免费下载使用。
完成下面两步后,将自动完成登录并继续当前操作。