小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

Meta超级智能实验室发布了首篇论文,提出了REFRAG框架,旨在优化RAG性能,最高可加速30倍。该框架通过压缩、感知和扩展来减少计算负担,保留关键信息,从而提升效率,适用于多种任务。

Meta超级智能实验室首篇论文:重新定义RAG

量子位
量子位 · 2025-09-08T08:46:27Z
Claude Sonnet 4扩展至100万标记的上下文窗口

Anthropic将Claude Sonnet 4升级至支持100万标记的上下文长度,提升五倍。此功能已公开测试,适用于Anthropic API和Amazon Bedrock,方便用户处理更大数据集。尽管此升级有助于上下文感知代理,但也增加了计算负担,开发者对此的实际价值看法不一。

Claude Sonnet 4扩展至100万标记的上下文窗口

InfoQ
InfoQ · 2025-08-22T13:20:00Z

本研究提出了一种双向强化学习框架,旨在解决多模态病理图像理解中的推理能力不足和计算负担问题。该方法通过无监督学习和动态令牌分配,在多项病理任务中平均提高了41.7%的性能,并减少了70.3%的推理成本。

Discovering the Principles of Pathology and Token Allocation for Efficient Multimodal Pathology Reasoning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z

本研究提出了一种新的协作分布式联邦学习方案,通过将模型分为三部分,实现客户端和服务器的并行训练与聚合,显著降低了计算和通信负担,提高了模型准确性。实验结果表明,该方案优于现有方法。

Collaborative Distributed Federated Learning with Parallel Training and Aggregation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-22T00:00:00Z

本研究提出了DropPEFT框架,旨在解决联邦微调在资源受限设备上的计算和内存负担问题。通过随机停用层和自适应dropout比率,显著提升了模型的收敛速度并降低了内存占用。

Efficient Federated Fine-Tuning of Large Language Models Based on Layer-wise Dropout

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-13T00:00:00Z

本研究提出了一种新颖的扩散增强检索(DAR)框架,旨在解决现有交互式文本到图像检索方法的计算负担和适应性问题,从而显著提高查询与图像的对齐精度。

Zero-Shot Interactive Text-to-Image Retrieval via Diffusion-Augmented Representation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-26T00:00:00Z

本研究提出了一种名为语言引导视觉令牌修剪(LVPruning)的方法,旨在减少多模态大型语言模型的计算负担。该方法通过评估视觉令牌的重要性,能够将视觉令牌数量减少至多90%,仅导致约0.45%的性能损失,显示出良好的应用潜力。

LV Pruning: An Effective and Simple Language-Guided Vision Token Pruning Method for Multi-Modal Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-23T00:00:00Z

本研究提出了一种新的长输入微调框架(LIFT),旨在解决大型语言模型在长上下文理解中的挑战,提升其在相关任务中的表现,并减轻计算负担。

提升:通过长输入微调改善长上下文理解

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-18T00:00:00Z

本研究提出了一种局部曲率平滑方法,解决了基于评分的扩散模型训练中的计算负担,特别是雅可比迹的计算问题。该方法显著提升了样本生成性能,尤其在高分辨率图像生成方面表现突出。

基于施泰因恒等式的局部曲率平滑实现高效的评分匹配

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z

本研究提出FedPT框架,旨在解决资源受限设备上微调大型语言模型的隐私和计算负担问题。该框架通过仅访问模型输出词汇的预测,显著降低计算、通信和内存开销,同时保持竞争性性能,具有广泛的应用潜力。

FedPT: Federated Proxy-Tuning of Large Language Models on Resource-Constrained Edge Devices

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-01T00:00:00Z

本文提出了一种基于GNN的方法,利用语义和局部几何形状来指导点云注册候选项的识别。通过识别语义实例关系,减少了点云注册的计算负担。在KITTI测距数据集上测试,相较于基准方法,实现了竞争性的准确度和更高的轨迹平滑度,同时依赖更少的网络参数。

SPEAL:基于骨骼先验的注意力学习的跨源点云配准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-14T00:00:00Z

本文研究了深度强化学习与知识蒸馏相结合的潜力,通过蒸馏各种DRL算法并研究其蒸馏效果,旨在减少深度模型的计算负担,保持性能的同时实现高效与快速。该研究有望促进DRL领域的发展。

在资源受限环境下利用知识蒸馏提升高效深度强化学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-16T00:00:00Z

该文介绍了一种名为语义推理(SINF)的新框架,通过利用潜在表示中的内在冗余来减少计算负担,可以识别物体属于的语义簇并执行与该语义簇相关的子图进行推理。在基准测试中,SINF 可以减少 VGG19、VGG16 和 ResNet50 的推理时间,同时只损失少量精度。

语义推理提高神经网络速度和准确性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-02T00:00:00Z

本文介绍了一种早期预测机制Exit Predictor,通过引导困难的数据样本绕过早期出口的计算,降低设备边缘混合推理系统中早期退出网络的计算负担。实验结果表明,该方法在准确性和设备计算负担之间取得了更好的折衷效果。

利用早期退出在自动调制分类中进行快速推断

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-22T00:00:00Z

本文提出了一种基于GNN的方法,利用语义和局部几何形状来指导点云注册候选项的识别。通过识别语义实例关系,减少了点云注册的计算负担。在KITTI测距数据集上测试,相较于基准方法,实现了竞争性的准确度和更高的轨迹平滑度,同时依赖更少的网络参数。

大规模室外点云配准的深度语义图匹配

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-10T00:00:00Z

本文提出了一种基于GNN的方法,利用语义和局部几何形状来指导点云注册候选项的识别。通过识别语义实例关系,减少了点云注册的计算负担。在KITTI测距数据集上测试,相较于基准方法,实现了竞争性的准确度和更高的轨迹平滑度,同时依赖更少的网络参数。

基于图注意力的 GNN 模型解释的语义解读和验证

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-08T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码