小红花·文摘

IntelliJ IDEA 开源代码库：构建和定制你的开发环境 | 开源日报 No.700

开源服务指南 ·

DiceHuBERT：基于自监督学习目标的HuBERT知识蒸馏

Apple Machine Learning Research ·

用于设备导向语音检测的自适应知识蒸馏

Apple Machine Learning Research ·

宣布在 Amazon SageMaker AI 中推出 Amazon Nova 定制功能

亚马逊AWS官方博客 ·

本研究提出了DeepKD框架，旨在解决知识蒸馏中目标类与非目标类知识冲突及低置信度噪声问题。通过双重解耦和自适应去噪，显著提升了知识转移效果。

DeepKD: A Deep Decoupling and Denoising Knowledge Distillation Trainer

BriefGPT - AI 论文速递 ·

本研究提出了UWSAM模型和UIIS10K数据集，旨在解决水下实例分割中的技术不足。通过知识蒸馏和自动生成水下提示，显著提高了分割的准确性和效率，推动了水下视觉任务的发展。

UWSAM: Underwater Instance Segmentation Based on 'Segment Anything Model' and Its Large-scale Benchmark Dataset

BriefGPT - AI 论文速递 ·

本研究探讨了问答系统中链式推理生成的可解释追踪与最终性能之间的关系。研究表明，基于规则的问题分解方法并不总能确保模型输出正确答案，挑战了知识蒸馏的假设。

Interpretable Traces, Unexpected Outcomes: Investigating the Disconnect in Trace-Based Knowledge Distillation

BriefGPT - AI 论文速递 ·

本研究提出了一种基于时间序列的知识蒸馏策略，用于锂离子电池容量衰减预测。经过微调的Battery-Timer模型展现出强大的零-shot泛化能力，显著提升了专家模型的多条件泛化能力。

Knowledge Distillation of Foundation Models for Battery Capacity Degradation Prediction

BriefGPT - AI 论文速递 ·

UniME框架由格灵深瞳和阿里ModelScope等团队联合发布，刷新了MMEB训练榜纪录。该框架通过文本判别知识蒸馏和困难负样本增强微调，显著提升了多模态理解能力，适用于多种下游任务，并已开源。

开源即屠榜！UniME多模态框架登顶MMEB训练榜，刷新多项SOTA纪录

量子位 ·

如何在本地安装Falcon 3？

DEV Community ·

本文探讨了大语言模型（LLMs）在资源受限环境中的优化问题，综述了知识蒸馏、模型量化和模型剪枝等压缩技术，提供了有效的解决方案和成功案例，为研究者和从业者在边缘设备上优化LLM提供参考。

Optimizing LLMs for Resource-Constrained Environments: A Survey of Model Compression Techniques

BriefGPT - AI 论文速递 ·

DEEVISum（蒸馏早期退出视觉语言模型用于摘要）旨在提升视频分段摘要的性能与效率。通过多模态提示和多阶段知识蒸馏，DEEVISum在保持性能的同时显著降低推理时间，F1得分达到61.1，展现出与更大模型的竞争力。

用于视频摘要的早期退出和多阶段知识蒸馏的视觉语言模型

BriefGPT - AI 论文速递 ·

本研究质疑知识蒸馏的安全性，提出通过在蒸馏数据集中嵌入后门触发器的对抗样本进行后门攻击的方法。实验表明，该方法能够在不影响教师模型的情况下，成功影响学生模型，揭示了知识蒸馏中的安全漏洞。

How to Conduct Backdoor Attacks on Knowledge Distillation

BriefGPT - AI 论文速递 ·

本研究提出了群体相对知识蒸馏（GRKD）框架，解决了现有知识蒸馏方法忽视教师模型关系性归纳偏置的问题。GRKD通过关注类别之间的相对排名提炼教师知识，实验表明其在细粒度分类任务中具有更优的泛化能力。

Group Relative Knowledge Distillation: Learning from Teacher's Relational Inductive Bias

BriefGPT - AI 论文速递 ·

本研究提出了一种新的知识蒸馏方法——头尾关注的KL散度（HTA-KL），旨在缩小脉冲神经网络（SNN）与人工神经网络（ANN）之间的性能差距。该方法通过动态区分高低概率区域并分配适应性权重，提升知识转移的平衡性，最终在多个数据集上表现优于现有方法。

Head-Tail-Aware KL Divergence in Knowledge Distillation for Spiking Neural Networks

BriefGPT - AI 论文速递 ·

CVPRW 2025 | 高效图像超分辨率中的蒸馏监督下的卷积低秩适应

实时互动网 ·

本研究探讨了知识蒸馏方法在资源受限环境中对小型语言模型性能和可解释性的影响，提出的新方法显著提升了模型表现，为大规模语言模型的应用奠定了基础。

Honey, I Shrunk the Language Model: The Impact of Knowledge Distillation Methods on Performance and Explainability

BriefGPT - AI 论文速递 ·

本研究提出双空间知识蒸馏（DSKD）框架，解决了白盒知识蒸馏在输出空间和词汇不兼容性的问题。通过统一模型预测头和精确标记对齐算法，DSKD显著提升了知识蒸馏效果，实验结果表明其在多个基准测试中优于现有方法。

A Dual-Space Framework for General Knowledge Distillation in Large Language Models

BriefGPT - AI 论文速递 ·

本研究提出了一种资源高效的波束预测方法，解决了传统方法在快速变化通信环境中的适应性不足。通过知识蒸馏将多模态网络知识转移至单模态网络，并结合自动驾驶模拟器生成的数据，显著降低计算复杂度，同时保持预测准确性。模拟结果显示，在使用教师网络10%参数的情况下，单模态模型性能达到94.62%。

Resource-Efficient Beam Prediction and Multimodal Realistic Simulation Framework in mmWave Communications

BriefGPT - AI 论文速递 ·

本文提出了GOTHAM框架，旨在解决图数据分析中的节点分类问题，特别是在标签不足的情况下处理新类。该框架结合原型表示和知识蒸馏技术，有效应对少量或无标签的新类，实验结果表明其在多种任务中具有良好的适应性和有效性。

GOTHAM: Graph Class Incremental Learning Framework under Weak Supervision

BriefGPT - AI 论文速递 ·