我们开发了一种无监督骨架动作识别系统,使用编码器-解码器递归神经网络,无需标签或深度输入即可运行。该系统在2D或3D关键点和附加提示下表现出色,跨视图性能优于最新无监督方法,接近有监督方法的效果。
该论文介绍了一种改进语言模型在其他语言上表现的方法,通过扩展标记器、初始化新词汇对应的嵌入,并使用基于凸包的初始化方法。实验结果显示,该方法在多语言环境下与其他复杂方法相媲美,证明即使使用简单的初始化方法,也能实现高效的大规模多语言持续预训练。
该研究提出了一种新颖的几何方法来评估大语言模型(LLM)的不确定性,利用凸包分析来度量模型输出的离散度和可变性,该方法通过将回答转化为高维嵌入,并使用主成分分析(PCA)将其投影到二维空间。实验结果表明,LLMs 模型的不确定性取决于提示的复杂性、模型和温度设置。
本文提出了一种嵌入有向无环图的新方法,使用证明能够更好地模拟树状结构的双曲空间,并使用一组嵌套的测地凸锥来定义分层关系,并证明这些蕴含锥体在欧几里得和双曲空间中均具有一种优化的形式,而且它们可以规范地定义嵌入学习过程。实验显示,我们的方法在表示能力和泛化方面都比最近的强有力的基线有显着的改进。
完成下面两步后,将自动完成登录并继续当前操作。