小红花·文摘 - 小红花技术领袖俱乐部

令牌选择的统计：Logits、温度与Top-P采样详解

令牌选择的统计：Logits、温度与Top-P采样详解

MachineLearningMastery.com ·

大型语言模型如何选择词汇：Logits、Softmax与采样的实用指南

大型语言模型如何选择词汇：Logits、Softmax与采样的实用指南

MachineLearningMastery.com ·

超越Logits：语言建模中的三元民主崛起

超越Logits：语言建模中的三元民主崛起

DEV Community ·

本研究提出了一种新框架，用于评估生成语言模型在任务级输出选择中的解码效率。研究发现，解码无关的候选选择方法在多样化任务中表现优异，为未来模型设计提供了重要见解，尤其是在大规模候选池的应用潜力方面。

Inferring from Logits: Exploring Best Practices for Decoding-Free Generative Candidate Selection

BriefGPT - AI 论文速递 ·

vllm 中的 sampling

vllm 中的 sampling

学习让我快乐 ·

本研究探讨了知识蒸馏的不同层次及其应用，提出了PTLoss和R2KD等改进方法，显著提升了模型性能。通过动态调整教师模型的输出，RLD方法有效消除了误导信息，保留了重要的类别相关性。实验结果表明，在CIFAR-100和ImageNet数据集上优于现有技术。

Kendall的$τ$系数用于Logits蒸馏

BriefGPT - AI 论文速递 ·

本文探讨深度学习中的对抗样本问题，提出多种提高模型鲁棒性的方法，包括对抗分布式训练（ADT）、Probabilistically Compact损失函数和对抗特征对齐（AFA）。研究表明，过度自信的模型更易受攻击，通过改进训练方法可提升模型在对抗攻击下的性能。

Achieving Adversarial Robustness through Debiasing High-Confidence Logits Alignment

BriefGPT - AI 论文速递 ·

该论文研究了通过隐式语义增强提高模型泛化性能的方法，并在三个基准测试数据集上实现了最先进的性能水平。该方法使用距离度量学习和交叉熵损失的 logits 作为输入特征。

SimMMDG: 一个简单而有效的多模态领域泛化框架

BriefGPT - AI 论文速递 ·