标签

 一致性 

相关的文章:

了解一致性测试与评估的最新研究进展,包括基准评估、神经高动态范围视频渲染、知识蒸馏等领域的相关内容。

不完全多视图聚类中延迟激活的互补性和一致性平衡

原文约200字,阅读约需1分钟。发表于:

本研究从不完整多视图聚类中提取有价值的互补信息,设计了一种平衡互补性和一致性的框架,其中包括延迟激活的双网络,通过最小化条件熵和最大化不同视图之间的互信息来恢复不完整信息和增强一致性学习。我们在四个公开数据集上进行了广泛比较实验,证明了 CoCo-IMC 的有效性。

本研究提出了一种平衡互补性和一致性的框架,通过最小化条件熵和最大化不同视图之间的互信息来恢复不完整信息和增强一致性学习。实验证明了该方法的有效性。

相关推荐 去reddit讨论

HC-GST: 基于异质性感知的分布一致性图自训练

原文约300字,阅读约需1分钟。发表于:

减少异质图自训练中同质比例分布偏移的新方法 HC-GST,通过使用软标签估计同质比例并优化选择向量,与全局同质比例分布对齐,从而有效地减小训练偏差并增强自训练性能。

本文提出了一种新的图结构HiGNN,通过研究每个节点在图中的邻居分布来利用异质性中的宝贵语义信息,增强具有相似语义特征的节点之间的连接性。实证评估和与其他方法比较表明,HiGNN在改进图表示方面有效,并通过整合异质性信息提升了现有基于GNN的方法。

相关推荐 去reddit讨论

中级任务迁移学习中任务选择的有效性与一致性探究

原文约300字,阅读约需1分钟。发表于:

通过实验和比较不同的任务选择方法,我们研究了中间任务选择对中间任务传递学习的影响,并发现使用 fine-tuned 权重构建的任务嵌入可以更好地估计任务的传递能力,但对于需要推理能力的任务,任务嵌入并不一定具有优势。此外,我们还引入了一种使用最大内积搜索来测量两两标记相似性的新方法,该方法在任务预测中表现最好。我们的研究结果表明,与平均权重相比,标记上的相似性更能预测任务的传递能力。

本文研究了将自然语言处理大规模语言模型fine-tuning应用于其他任务的有效性。通过在33个NLP任务上的数据验证,结果显示在数据稀缺情况下,transfer learning仍然有效。同时提出了预测最具可转移性源任务的任务嵌入,并验证了其在数据大小、源和目标之间的有效性。结果显示源数据大小、任务和领域的相似性和任务的复杂性在决定转移性方面起着关键作用。

相关推荐 去reddit讨论

基于模糊决策系统中的可分离性和一致性的级联两阶段特征聚类和选择

原文约300字,阅读约需1分钟。发表于:

提出了一种两阶段级联特征聚类和选择算法,该算法通过聚类相关特征并解决特征间的冗余性来在模糊决策系统中减少搜索空间。其中,第一阶段通过聚类减少搜索空间,第二阶段通过基于聚类的顺序前向选择方法来探索数据的全局和局部结构。实验证明该算法在分类准确率和所选特征数量上优于基准算法。

该研究提出了一种两阶段级联特征聚类和选择算法,通过减少搜索空间来提高分类准确率和所选特征数量。

相关推荐 去reddit讨论

增强的 H 一致性界

原文约400字,阅读约需1分钟。发表于:

基于条件遗憾的关系,我们提出了一种通用框架来建立增强的 H 一致性边界,这些边界不仅包括现有结果的特例,还能在各种情况下导出更有利的边界,例如:标准多类分类、Tsybakov 噪声条件下的二元和多类分类以及二部排序。

本文研究了学习延迟的替代损失函数,并引入了一类由非递增函数参数化的广泛替代损失。研究结果表明,在假设集对称且完备的情况下,这些损失具有一致性界限。此外,研究还确定了参数选择,以实现任何通用成本函数的一致性替代损失。最后,对提出的替代损失进行了经验评估。

相关推荐 去reddit讨论

增强神经高动态范围视频渲染的时间一致性曝光补全

原文约300字,阅读约需1分钟。发表于:

提出一种新的方法通过补充缺失的曝光信息来渲染高动态范围 (HDR) 视频帧,从而获得完整和一致的曝光信息,改善了噪点和幽灵伪影,提高了时间一致性。

该研究介绍了一种基于学习的系统,使用深度神经网络解决低动态范围相机处理宽动态范围输入时的过曝问题。通过引入过去的参考帧作为额外输入,训练了一个决定是否将当前帧作为未来参考帧的深度神经网络。实现了高动态范围成像。

相关推荐 去reddit讨论

基准一致性测试的正确实施指南:LLM 基准评估

原文约500字,阅读约需2分钟。发表于:

通过分析超过 40 个知名基准测试,我们展示了一些被忽视的方法选择如何显著影响基准一致性测试结果,从而潜在地削弱结论的有效性。为了解决这些不一致性,我们提出了 BAT 的一套最佳实践,并展示利用这些方法论如何大大提高了 BAT 的鲁棒性和有效性。我们还引入了 BenchBench,一个用于 BAT 的 Python 包,并发布了...

计算机科学(CS)是人工智能和现代社会发展的关键。CS-Bench是第一个用于评估LLM在CS领域性能的基准,通过对30多个LLM进行评估,揭示了性能与模型规模的关系,并分析了失败原因。LLM在计算机科学领域能力与数学和编码能力相关,专注于数学和编码的LLM在多个CS子领域表现出强大性能。CS-Bench将成为LLM在CS领域应用的基石,并为评估LLM的推理能力开辟新途径。

相关推荐 去reddit讨论

JointDreamer:通过联合分数蒸馏确保文本到 3D 生成中的几何一致性和文本相符

原文约400字,阅读约需1分钟。发表于:

提出了一种新的 Score Distillation Sampling(SDS)范式,即 Joint Score Distillation(JSD),可以确保一致的 3D 生成,并通过引入能量函数捕捉扩散模型中去噪图像的连贯性来推导多个呈现视图上的联合评分蒸馏。通过引入 Geometry Fading 方案和 Classifier-Free Guidance Switching...

研究提出了一种新的Score Distillation Sampling(SDS)范式,即Joint Score Distillation(JSD),通过引入能量函数捕捉扩散模型中去噪图像的连贯性来推导多个呈现视图上的联合评分蒸馏。通过引入Geometry Fading方案和Classifier-Free Guidance Switching策略来增强生成细节,取得了杰出结果。

相关推荐 去reddit讨论

通过约束满足度评估任务导向对话的一致性

原文约400字,阅读约需1分钟。发表于:

任务导向对话必须保持一致性,包括对话内部的逻辑连贯性和与对话领域的外部知识的准确反映。我们提出将对话一致性概念化为约束满足问题,其中变量代表对话中涉及对话领域的段落,而变量之间的约束反映了包括语言、对话和领域在内的对话属性。通过实验,我们利用约束满足问题求解器检测由 LLM 重新词汇化的对话中的不一致性。我们的研究结果表明:(i)约束满足问题对于检测对话的不一致性非常有效;(ii)优秀的...

该研究将对话一致性概念化为约束满足问题,并通过实验检测了LLM重新词汇化对话中的不一致性。结果表明,约束满足问题对于检测对话的不一致性非常有效,而优秀的LLMs在对话的一致性重新词汇化方面存在挑战。此外,源自领域知识的约束是最难被遵守的。研究认为,约束满足问题能够捕捉到对话一致性的核心特性。

相关推荐 去reddit讨论

知识蒸馏的不变一致性

原文约400字,阅读约需1分钟。发表于:

知识蒸馏技术中,我们引入了不变一致性蒸馏法(ICD),该方法结合了对比学习和明确的不变性惩罚,以确保学生模型的表示与教师一致,并在 CIFAR-100 数据集上证明其优于传统知识蒸馏技术和 13 种最先进方法,在一些情况下,学生模型的准确性甚至超过教师模型。

本文介绍了一种面向少教师推理的知识蒸馏方法(FTI KD),通过比较式知识蒸馏(CKD)来减少对教师模型推理的依赖。实验证明,CKD优于最先进的数据增强和知识蒸馏技术。

相关推荐 去reddit讨论