小红花·文摘

Meta超级智能实验室发布了首篇论文，提出了REFRAG框架，旨在优化RAG性能，最高可加速30倍。该框架通过压缩、感知和扩展来减少计算负担，保留关键信息，从而提升效率，适用于多种任务。

量子位 ·

InfoQ ·

本研究提出了一种双向强化学习框架，旨在解决多模态病理图像理解中的推理能力不足和计算负担问题。该方法通过无监督学习和动态令牌分配，在多项病理任务中平均提高了41.7%的性能，并减少了70.3%的推理成本。

BriefGPT - AI 论文速递 ·

本研究提出了一种新的协作分布式联邦学习方案，通过将模型分为三部分，实现客户端和服务器的并行训练与聚合，显著降低了计算和通信负担，提高了模型准确性。实验结果表明，该方案优于现有方法。

BriefGPT - AI 论文速递 ·

本研究提出了DropPEFT框架，旨在解决联邦微调在资源受限设备上的计算和内存负担问题。通过随机停用层和自适应dropout比率，显著提升了模型的收敛速度并降低了内存占用。

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的扩散增强检索（DAR）框架，旨在解决现有交互式文本到图像检索方法的计算负担和适应性问题，从而显著提高查询与图像的对齐精度。

BriefGPT - AI 论文速递 ·

本研究提出了一种名为语言引导视觉令牌修剪（LVPruning）的方法，旨在减少多模态大型语言模型的计算负担。该方法通过评估视觉令牌的重要性，能够将视觉令牌数量减少至多90%，仅导致约0.45%的性能损失，显示出良好的应用潜力。

BriefGPT - AI 论文速递 ·

本研究提出了一种新的长输入微调框架（LIFT），旨在解决大型语言模型在长上下文理解中的挑战，提升其在相关任务中的表现，并减轻计算负担。

BriefGPT - AI 论文速递 ·

本研究提出了一种局部曲率平滑方法，解决了基于评分的扩散模型训练中的计算负担，特别是雅可比迹的计算问题。该方法显著提升了样本生成性能，尤其在高分辨率图像生成方面表现突出。

BriefGPT - AI 论文速递 ·

本研究提出FedPT框架，旨在解决资源受限设备上微调大型语言模型的隐私和计算负担问题。该框架通过仅访问模型输出词汇的预测，显著降低计算、通信和内存开销，同时保持竞争性性能，具有广泛的应用潜力。

BriefGPT - AI 论文速递 ·

本文提出了一种基于GNN的方法，利用语义和局部几何形状来指导点云注册候选项的识别。通过识别语义实例关系，减少了点云注册的计算负担。在KITTI测距数据集上测试，相较于基准方法，实现了竞争性的准确度和更高的轨迹平滑度，同时依赖更少的网络参数。

BriefGPT - AI 论文速递 ·

本文研究了深度强化学习与知识蒸馏相结合的潜力，通过蒸馏各种DRL算法并研究其蒸馏效果，旨在减少深度模型的计算负担，保持性能的同时实现高效与快速。该研究有望促进DRL领域的发展。

BriefGPT - AI 论文速递 ·

该文介绍了一种名为语义推理（SINF）的新框架，通过利用潜在表示中的内在冗余来减少计算负担，可以识别物体属于的语义簇并执行与该语义簇相关的子图进行推理。在基准测试中，SINF 可以减少 VGG19、VGG16 和 ResNet50 的推理时间，同时只损失少量精度。

BriefGPT - AI 论文速递 ·

本文介绍了一种早期预测机制Exit Predictor，通过引导困难的数据样本绕过早期出口的计算，降低设备边缘混合推理系统中早期退出网络的计算负担。实验结果表明，该方法在准确性和设备计算负担之间取得了更好的折衷效果。

BriefGPT - AI 论文速递 ·

BriefGPT - AI 论文速递 ·

BriefGPT - AI 论文速递 ·