本文提出了声学邻居嵌入的理论框架,解释了可变宽度音频或文本的音素内容在固定维度嵌入空间中的表示。通过定量定义词语音素相似性,提出了嵌入距离的概率解释。研究表明,该框架可用于音频和文本嵌入的最近邻搜索,分类准确率与有限状态转换器相同,并在词汇恢复和方言聚类中表现优异。所有源代码和预训练模型均已提供。
该系统利用最近邻搜索进行异常检测,无需标记异常类型。它将正常活动嵌入Qdrant,实时分析新视频片段以识别异常,适用于监控和制造安全等领域,降低云处理成本。
本研究比较了多种边缘设备上的图基近似最近邻搜索算法,评估其在实时应用中的表现,发现某些算法在效率和适应性方面优于其他算法,为边缘设备的实时跟踪系统提供了新见解。
本文提出了一种通用框架,用于端到端学习数据结构,适应底层数据分布,并精细控制查询和空间复杂度,解决了最近邻搜索问题,发现多维数据中的有效结构,具有广泛的应用潜力。
本研究提出了一种新的扩展最近邻搜索的方法,通过对抗性训练任务来保证准确性。实验证明该方法在淘宝广告平台上有效,带来了可观的收入增长。
kNN-LMs是将预训练的神经语言模型与k最近邻居模型线性插值的新模型,通过此方法在Wikitext-103 LM中实现了困惑度为15.79,提高了2.9点,无需额外训练。该方法在扩展到更大的训练数据和实现领域自适应方面也表现出良好效果。最近邻搜索在长尾系统的语言建模中是一种有效的方法。
该研究将预训练的神经语言模型与$k$最近邻居模型线性插值,提高了Wikitext-103 LM的困惑度至15.79,无需额外训练。该方法在扩展到更大训练数据和实现领域自适应方面也表现出良好效果。作者认为最近邻搜索是长尾系统语言建模中有效的方法。
完成下面两步后,将自动完成登录并继续当前操作。