本研究提出了一种通用的可理解性度量方法,旨在解决代理与人类合作中的可理解性不足问题,指导代理生成更易于人类理解的信息,并为未来研究奠定基础。
本研究提出了一种新颖的度量方法,成功聚类了1768900个多项式连续分数公式,识别出许多已知及新发现的数学常数,显著提高了公式发现的效率。
本文介绍了一种新的度量方法CRV,用于评估自我监督语音表示的属性。研究发现,CRV与语音测试精度呈正相关。
本研究探索了大型语言模型(LLMs)解决长篇数学问题的能力,并提出了新的度量方法,改善了LLMs在解决这类问题上的表现。研究结果表明,该方法不仅在小学数学问题上取得了改善,还为将LLMs应用于复杂的现实应用提供了实际解决方案。
本文提出了一种评估视频摘要的方法,通过文本表示和NLP度量方法来衡量其与基准文本摘要的语义距离。该方法具有更高的人类判断一致性,并提供了公开可用的视频数据集的文本注释和基准文本摘要。
研究人员通过检验131个不同的DL体系结构,并在三个医学图像数据集上捕捉性能-资源权衡的趋势,引入了一种新的度量方法来估计每个资源单位的性能。他们还展示了使用预训练模型可以显著减少计算资源和数据要求,希望这项工作可以鼓励开发更小的资源占用方法和模型,提高AI的公平性。
本文介绍了一种基于群集相似性的车辆再识别方法,利用附近车辆信息提高准确性。实验结果在VeRi数据集上相对改进了204%。讨论了车辆在相邻摄像头间的位置变化对识别效果的影响,并提出了两个度量方法。该方法适用于桥梁场景和其他场景。
最近的研究发现,语言模型中的激活可以通过稀疏线性组合来建模。研究者开发了度量方法来评估这些稀疏编码技术的成功,并测试了线性和稀疏假设的有效性。研究结果显示,语言模型的激活可以准确地被特征的稀疏线性组合所建模,且模型的激活在第一层和最后一层似乎是最稀疏的。
该研究提出了一种新的度量方法,用于评估生成网络的建模能力。该方法使用树状图来比较真实数据和生成数据之间的差异,特别关注无法捕捉训练集中所有模式的生成器。验证结果表明该方法具有竞争力。
本文提出了一种实用鲁棒性度量方法,针对14个算法和CO问题进行了广泛实验,发现最先进算法在难例上性能下降超过20%,引起对组合优化求解器鲁棒性的担忧。
该论文提出了一种新的基于概率方法的度量方法,用来评估生成模型的忠实度和多样性。该方法已在玩具实验和最先进的生成模型上进行了广泛研究,并可在GitHub上获得代码。
本文介绍了一种新颖的度量方法DTW+S,用于测量时间序列数据之间的距离或相似性。该方法创建了一个可解释的时间序列“接近保持”矩阵表示,并应用动态时间规整来计算这些矩阵之间的距离。研究人员可以使用该方法来查找相似时间点附近发生的相似趋势,并在集成构建和流行病曲线聚类中应用。此外,该方法在某类数据集上的分类效果更好,特别是当局部趋势而非尺度起决定性作用时。
完成下面两步后,将自动完成登录并继续当前操作。