小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
ICLR 2026 | 对抗扩散压缩算法在真实世界视频重建任务中的应用

本文提出了一种改进的对抗扩散压缩方法(AdcVSR),用于真实世界视频超分辨率。该方法通过剪枝和轻量级一维卷积,显著降低模型参数和推理时间,同时保持视频质量。实验结果表明,AdcVSR在减少95%参数的同时,实现约8倍的速度提升,优化了细节生成与时域一致性。

ICLR 2026 | 对抗扩散压缩算法在真实世界视频重建任务中的应用

实时互动网
实时互动网 · 2026-03-10T03:21:37Z
告别推理时间忽高忽低!TensorRT 性能优化完全指南

本文讨论了TensorRT推理时间不稳定的问题,主要由于GPU动态调频和虚拟内存管理不当。通过锁定GPU频率和关闭虚拟内存,可以显著提高推理性能,确保推理时间的稳定性。作者提供了适用于Windows系统和NVIDIA GPU的详细优化步骤。

告别推理时间忽高忽低!TensorRT 性能优化完全指南

dotNET跨平台
dotNET跨平台 · 2026-01-20T23:55:37Z
Vercel推出多模型集成的AI Gateway

Vercel推出AI Gateway,简化开发者对多种大型语言和生成模型的访问。该服务通过单一API端点支持自带API密钥,具备低延迟和故障转移机制,确保稳定的推理时间,并提供详细日志和性能指标,提升AI应用构建效率,关注路由、可靠性和监控。

Vercel推出多模型集成的AI Gateway

InfoQ
InfoQ · 2025-09-12T12:31:00Z

本研究提出了SpecReason方案,旨在解决推理时间中的高延迟问题。该方法通过轻量模型推测中间步骤,减少对重模型的依赖,实现了1.5-2.5倍的速度提升和1.0-9.9%的准确性提高。

SpecReason: Achieving Fast and Accurate Inference Time Calculation through Intermediate Step Prediction

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-10T00:00:00Z

本研究提出了一种名为图编辑网络(GEN)的新型学习方法,旨在解决现有图编辑距离计算在可变操作成本下的不足。实验结果表明,GEN在实际和合成数据集上显著降低了错误率和推理时间,证明了其有效性和适应性。

Flexible Graph Similarity Computation with Proactive Optimization Strategy

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-09T00:00:00Z

本研究提出了φ-解码策略,通过前瞻性采样和聚类优化推理时间,提升自回归生成方法的效率和性能。实验结果表明,φ-解码在多个基准测试中优于现有方法,具备良好的通用性和可扩展性。

φ-Decoding: Adaptive Foresight Sampling for Balanced Exploration and Exploitation of Inference Time

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-17T00:00:00Z

本研究提出了一种专用的反馈和编辑模型,旨在优化开放性任务中的推理时间扩展。通过模仿人类反馈改进过程,利用70B规模的Llama 3模型,在Arena Hard基准测试中实现了92.7的性能,超越了多个现有模型。

Dedicated Feedback and Edit Models Enhance Inference-Time Scaling for Open-Domain Tasks

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-06T00:00:00Z

本研究提出了一种基于AMIS算法的快速可扩展姿态估计器,旨在解决工业应用中实时反馈的速度与准确性问题。该模型在四个基准数据集上表现优异,实现了推理时间与准确度的优化平衡。

Efficient Pose Estimation in 6D: Scalable and High-Performance 6D Object Pose Estimation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-19T00:00:00Z

本研究探讨了多模态推理中视觉与文本结合的过程,分析了基于采样和树搜索的推理时间扩展方法,结果显示多模态思维在性能上优于传统文本思维,但处理丰富视觉输入时需要更多标记。

探索多模态思维的推理时间扩展:初步研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z

本文提出了一种新的无学习令牌压缩方法,旨在降低视觉-语言模型的计算成本和推理时间。该方法在空间和时间维度上进行压缩,显著提升了模型的推理能力和效率,同时保持了性能。实验结果表明,该方法在视频问答任务中实现了显著的效率提升。

Learning-Free Token Compression for Multi-Modal Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-29T00:00:00Z
OpenAI发布关于推理时间计算以增强AI安全性的研究

OpenAI的研究表明,增加推理时间可以提升AI模型对抗攻击的鲁棒性。实验结果显示,更多计算资源能有效降低攻击成功率,尤其在数学、问答和图像分类任务中。然而,模型在缺乏明确目标时仍可能被攻击者利用漏洞,且计算效率低下也会导致脆弱性。

OpenAI发布关于推理时间计算以增强AI安全性的研究

InfoQ
InfoQ · 2025-01-25T15:09:00Z

OpenAI的新研究表明,增加推理时间可以显著提高模型对抗攻击的稳健性,减少对对抗性训练的依赖。实验结果显示,推理计算增加后,模型抵御攻击的成功率提升,尤其在多种攻击方式下表现良好。但研究也指出该方法存在局限性,需进一步探索。

OpenAI新研究:o1增加推理时间就能防攻击,网友:DeepSeek也受益

量子位
量子位 · 2025-01-23T07:02:22Z
以推理时间计算换取对抗鲁棒性

对抗攻击的鲁棒性是人工智能领域的难题。研究发现,微小的扰动可能导致模型错误分类。尽管已有大量研究,防御对抗攻击的问题仍未解决。最新研究表明,增加推理时间的计算资源可能提升模型的鲁棒性。

以推理时间计算换取对抗鲁棒性

OpenAI
OpenAI · 2025-01-22T10:00:00Z
交大O1医疗探索:延长AI思考时间,解锁复杂推理诊断

上海交通大学研究表明,延长AI推理时间可显著提升医疗诊断能力,准确率提高6%-11%。AI通过系统分析症状,逐步排除不符合的诊断选项,表现接近专业医生。这一方法在真实医疗场景中取得良好效果,为AI的临床应用提供新思路。

交大O1医疗探索:延长AI思考时间,解锁复杂推理诊断

机器之心
机器之心 · 2025-01-15T07:39:59Z
对标o1,Kimi放出了最能打的国产模型

AI领域正经历技术变革,推理时间成为性能提升的关键。OpenAI的o1引领大模型突破,国内Kimi推出k0-math模型,其数学能力对标o1-mini和o1-preview。k0-math通过强化学习和思维链提升解题能力,表现优于o1系列。同时,Kimi探索版在推理能力上也实现了突破,提升了搜索效率。

对标o1,Kimi放出了最能打的国产模型

机器之心
机器之心 · 2024-11-18T02:21:00Z

卡内基梅隆大学提出的Run-Length Tokenization(RLT)方法通过合并重复图像块,显著提高视频生成模型的训练和推理速度,训练时间减少30%,推理时间减少67%,且精度损失极小,特别适用于高帧率和长视频。

视频大模型无损提速:删除多余token,训练时间减少30%,帧率越高效果越好

量子位
量子位 · 2024-11-17T12:39:06Z

本文提出了一种基于BERT模型的方法,自动从简历和职位中提取能力,显著提升招聘效率。在丹麦标注语料库上训练后,该方法在职位匹配中节省了50%以上的推理时间。

丹麦能力的联合提取与分类以进行职位匹配

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-29T00:00:00Z

本研究通过引入VX-S3DIS数据集和RESSCAL3D++方法,解决了三维场景理解中获取与处理分开的局限性。提出了一种高效的联合获取与语义分割方式,大幅加速并降低成本,首次预测时间仅占总推理时间的7%。

RESSCAL3D++: Joint Acquisition and Semantic Segmentation of 3D Point Clouds

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

本文介绍了Text-Conditioned Token Selection(TCTS)方案,通过文本信息选择最佳选项,提高图像生成质量和语义对齐度。结合Frequency Adaptive Sampling(FAS),进一步提升效果。实验显示,TCTS与FAS在图像-文本对齐和图像质量上优于基线,并将推理时间缩短50%以上。

无训练的投机雅可比解码加速自回归文本到图像生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-02T00:00:00Z

该研究提出了一种基于纯MLP架构的点云配准网络,解决了传统方法在资源受限环境中的高计算和内存需求问题。通过离线构建几何信息嵌入,显著降低了推理时间和资源消耗,提高了点云分析的速度和可靠性。

GERA:高效点云配准分析的几何嵌入

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-01T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码