小红花·文摘

文章探讨了逆萨丕尔-沃夫假说，指出语言结构强迫使用者表达特定信息，如性别和时间。编程语言如Python和JavaScript也要求开发者关注求值顺序和类型声明，影响思维方式。作者认为编程语言设计在便利与强制之间存在权衡。

读：逆萨丕尔-沃夫假说与编程语言

暗无天日 ·

本研究利用统计建模分析大规模语言数据，探讨语言结构特征的分类问题，提供新的分析工具，增强语言类型学研究的深度与广度。

Computational Linguistic Typology

BriefGPT - AI 论文速递 ·

本研究探讨了婴儿对语音和语言结构的感知，提出了一种基于预测编码的小型生成神经网络模型。实验结果表明，婴儿期后学习第二语言会增加外语学习的难度，强调了感知收敛效应的重要性。

Developmental Predictive Coding Model for Continual Learning of Mono and Bilingual Speech in Early Infancy

BriefGPT - AI 论文速递 ·

为AI原住民设计未来

UX Magazine ·

本文探讨了自然语言处理中的语言结构概率分布评估，提出了一种分析校准的方法，并比较了多种模型的误校准情况。研究发现，预训练模型在特定领域的校准性较好，并提出自适应温度缩放等方法以提高校准水平。此外，研究解决了大型语言模型评估中的透明性问题，提出基于发散的校准方法，显著提升了检测性能，推动了科学评估与伦理应用的发展。

Calibrating Verbal Probabilities for Large Language Models

BriefGPT - AI 论文速递 ·

本文研究了预训练语言模型通过无监督学习中的遮盖和预测标记来改进语言结构和下游性能。实验证明，预训练模型的性能提升主要来自通用掩码，而非词典关联。通过最小生成树的无监督解析评估，发现简单形成最小生成树优于经典的无监督解析方法。

基于语法掩码的 LLM 模型任务中的语法合法性保证

BriefGPT - AI 论文速递 ·

该论文提出了一种新的系统和方法，用于开发高效大型语言模型。研究发现了允许模型不同部分共享参数的新方法，从而减少所需的唯一参数总数。该方法确保了模型在保持紧凑的同时不牺牲其学习和表示复杂语言结构的能力。该研究为创建更高效和有效的大型语言模型提供了宝贵的见解和工具。

通过模型特征评估对话游戏自对话性能所需参数数量

BriefGPT - AI 论文速递 ·

该论文提出了一种新的系统和方法，用于开发高效大型语言模型。研究发现了一种允许模型不同部分共享参数的方法，从而减少所需的唯一参数总数。该方法确保了模型在保持紧凑的同时不牺牲其学习和表示复杂语言结构的能力。该研究为创建更高效和有效的大型语言模型提供了宝贵的见解和工具。

超小型语言模型

BriefGPT - AI 论文速递 ·

本文研究了预训练语言模型如何通过无监督学习中的遮盖和预测标记产生语言结构和改进下游性能。通过构建类似填空的掩码，并用于三个不同的分类数据集，证明了预训练模型的绝大部分性能提升来自没有与词典关联的通用掩码。同时，本文提出了一种提取该模型中学习到的统计依赖的方法，这些依赖以句法结构的形式编码。在无监督解析方面，简单地形成最小生成树优于经典的无监督解析方法。

预训练遮蔽语言模型中社会偏见和任务表现的预测因素分析

BriefGPT - AI 论文速递 ·