小红花·文摘

ICLR 2026 | 对抗扩散压缩算法在真实世界视频重建任务中的应用

实时互动网 ·

告别推理时间忽高忽低！TensorRT 性能优化完全指南

dotNET跨平台 ·

Vercel推出多模型集成的AI Gateway

InfoQ ·

本研究提出了SpecReason方案，旨在解决推理时间中的高延迟问题。该方法通过轻量模型推测中间步骤，减少对重模型的依赖，实现了1.5-2.5倍的速度提升和1.0-9.9%的准确性提高。

SpecReason: Achieving Fast and Accurate Inference Time Calculation through Intermediate Step Prediction

BriefGPT - AI 论文速递 ·

本研究提出了一种名为图编辑网络（GEN）的新型学习方法，旨在解决现有图编辑距离计算在可变操作成本下的不足。实验结果表明，GEN在实际和合成数据集上显著降低了错误率和推理时间，证明了其有效性和适应性。

Flexible Graph Similarity Computation with Proactive Optimization Strategy

BriefGPT - AI 论文速递 ·

本研究提出了φ-解码策略，通过前瞻性采样和聚类优化推理时间，提升自回归生成方法的效率和性能。实验结果表明，φ-解码在多个基准测试中优于现有方法，具备良好的通用性和可扩展性。

φ-Decoding: Adaptive Foresight Sampling for Balanced Exploration and Exploitation of Inference Time

BriefGPT - AI 论文速递 ·

本研究提出了一种专用的反馈和编辑模型，旨在优化开放性任务中的推理时间扩展。通过模仿人类反馈改进过程，利用70B规模的Llama 3模型，在Arena Hard基准测试中实现了92.7的性能，超越了多个现有模型。

Dedicated Feedback and Edit Models Enhance Inference-Time Scaling for Open-Domain Tasks

BriefGPT - AI 论文速递 ·

本研究提出了一种基于AMIS算法的快速可扩展姿态估计器，旨在解决工业应用中实时反馈的速度与准确性问题。该模型在四个基准数据集上表现优异，实现了推理时间与准确度的优化平衡。

Efficient Pose Estimation in 6D: Scalable and High-Performance 6D Object Pose Estimation

BriefGPT - AI 论文速递 ·

本研究探讨了多模态推理中视觉与文本结合的过程，分析了基于采样和树搜索的推理时间扩展方法，结果显示多模态思维在性能上优于传统文本思维，但处理丰富视觉输入时需要更多标记。

探索多模态思维的推理时间扩展：初步研究

BriefGPT - AI 论文速递 ·

本文提出了一种新的无学习令牌压缩方法，旨在降低视觉-语言模型的计算成本和推理时间。该方法在空间和时间维度上进行压缩，显著提升了模型的推理能力和效率，同时保持了性能。实验结果表明，该方法在视频问答任务中实现了显著的效率提升。

Learning-Free Token Compression for Multi-Modal Large Language Models

BriefGPT - AI 论文速递 ·

OpenAI发布关于推理时间计算以增强AI安全性的研究

InfoQ ·

OpenAI的新研究表明，增加推理时间可以显著提高模型对抗攻击的稳健性，减少对对抗性训练的依赖。实验结果显示，推理计算增加后，模型抵御攻击的成功率提升，尤其在多种攻击方式下表现良好。但研究也指出该方法存在局限性，需进一步探索。

OpenAI新研究：o1增加推理时间就能防攻击，网友：DeepSeek也受益

量子位 ·

以推理时间计算换取对抗鲁棒性

OpenAI ·

交大O1医疗探索：延长AI思考时间，解锁复杂推理诊断

机器之心 ·

对标o1，Kimi放出了最能打的国产模型

机器之心 ·

卡内基梅隆大学提出的Run-Length Tokenization（RLT）方法通过合并重复图像块，显著提高视频生成模型的训练和推理速度，训练时间减少30%，推理时间减少67%，且精度损失极小，特别适用于高帧率和长视频。

视频大模型无损提速：删除多余token，训练时间减少30%，帧率越高效果越好

量子位 ·

C# OnnxRuntime yolov11 detection

dotNET跨平台 ·

本研究通过引入VX-S3DIS数据集和RESSCAL3D++方法，解决了三维场景理解中获取与处理分开的局限性。提出了一种高效的联合获取与语义分割方式，大幅加速并降低成本，首次预测时间仅占总推理时间的7%。

RESSCAL3D++: Joint Acquisition and Semantic Segmentation of 3D Point Clouds

BriefGPT - AI 论文速递 ·

该研究提出了一种基于纯MLP架构的点云配准网络，解决了传统方法在资源受限环境中的高计算和内存需求问题。通过离线构建几何信息嵌入，显著降低了推理时间和资源消耗，提高了点云分析的速度和可靠性。

GERA: Geometric Embedding for Efficient Point Cloud Registration Analysis

BriefGPT - AI 论文速递 ·

本文介绍了MiniVLM，一个轻量快速的视觉-语言模型，模型大小减少73%，推理时间降低94%，在视觉-语言任务上保持94-97%的准确率。同时，研究探讨了视觉语言模型在细粒度理解上的局限性，并提出了优化方法以提升性能。

响应广泛关闭：基本视觉语言模型能力中的惊人观察

BriefGPT - AI 论文速递 ·