小红花·文摘

AI 论文周报丨递归推理方法/轻量级解码器架构/深度卷积神经网络架构……多领域前沿动态一览

HyperAI超神经 ·

Agent设计模式——第 17 章：推理技术

XINDOO的博客 ·

本研究针对机器学习服务中的隐私问题，提出了一种基于密码技术的私密变压器推理方法，以保护用户数据和模型隐私，并回顾了相关进展与挑战。研究表明，该方法能有效平衡资源效率与隐私保护。

机器学习即服务中的私密变压器推理：综述

BriefGPT - AI 论文速递 ·

本研究提出了ZeroTIR工具集成推理方法，以解决大型语言模型在数学推理中的计算精度不足问题。研究表明，强化学习训练的进展与自发代码执行频率、响应长度和任务准确率之间存在显著正相关，揭示了计算努力与工具辅助推理策略的关系。

代理强化学习缩放法则：代理强化学习通过自发代码执行进行数学问题解决

BriefGPT - AI 论文速递 ·

DeepDistill：新型大语言模型推理方法超越蒸馏模型，接近最先进水平

DEV Community ·

本文解决了现有视觉语言模型（VLMs）在对抗鲁棒性和幻觉减缓方面的不足，提出了一种名为Hydra的自适应代理框架。Hydra通过迭代推理和结构化评估，显著提高了模型在面对对抗扰动和模型内在错误时的稳健性，并在多项基准测试中表现超越传统方法，展现出在现实应用中提升VLM可靠性的潜力。

Hydra：增强对抗鲁棒性和减轻视觉语言模型幻觉的代理推理方法

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的推理方法，针对大语言模型在推理计算中的效率问题。通过优化Mamba模型，尽管零样本性能有所下降，但在固定计算预算下，其在数学推理数据集上的覆盖率和准确性优于变换器教师模型，为推理计算的扩展提供了新方向。

Thinking Slow, Fast: Scaling Inference Computation with Distilled Reasoners

BriefGPT - AI 论文速递 ·

本文提出了一种新颖的推理方法——选项流（FoO），旨在解决大型语言模型的内在偏差问题。FoO能够系统性地探讨多种推理可能性，理论验证显示其在机器学习任务中提升了38.2%-69.2%，具有广泛的适用性和成本效益。

Option Flow: Achieving Diverse and Improved LLM Reasoning through Option Thinking

BriefGPT - AI 论文速递 ·

本研究针对绿色建筑设计决策中的知识广泛性和低效问题，创新性地将大型语言模型与决策支持结合，开发了GreenQA问答框架，能够实现多模态数据推理。研究表明，使用GreenQA平台的用户中有96%的人认为它有效提升了设计效率，为人工智能辅助设计提供新的灵感。

基于大型语言模型的绿色建筑设计决策问答：一种多模态数据推理方法

BriefGPT - AI 论文速递 ·

本研究探讨了多模态大型语言模型在复杂环境中的规划能力不足，提出了EgoPlan-Bench2基准测试，涵盖24个日常场景，并提出了一种无训练的多模态推理方法，以提升模型的规划能力。

EgoPlan-Bench2：用于多模态大型语言模型规划的基准测试

BriefGPT - AI 论文速递 ·

本文提出了一种新算法——分阶段投机性解码，旨在加速小批量大型语言模型（LLM）的推断。该方法通过重组投机性批量为树结构并增加第二阶段解码，成功将解码延迟降低了3.16倍，同时保持输出质量。此外，研究还探讨了推测解码的训练方法，显著提高了模型的效率和性能。

高效推理方法的深入分析：投机解码的综述

BriefGPT - AI 论文速递 ·

本文提出了一种高效的大语言模型推理方法，通过序列调度技术实现86%的推理吞吐量提升。研究分析了LLM推理技术的瓶颈，探讨了优化策略和未来研究方向，强调了在资源有限环境中提升性能的潜力。

优化样本计算分配的LLM推理扩展

BriefGPT - AI 论文速递 ·

本文介绍了多种地理语言模型的创新，如SpaBERT、GeoGLUE、GeoNorm和GeoLLM，强调它们在地理实体识别、链接和空间推理等任务中的显著性能提升。这些模型结合了空间坐标嵌入和大型语言模型的优势，推动了地理空间决策与自然语言处理的融合，展现了在地理数据理解和应用中的潜力。

GeoReasoner：基于地理上下文的自然语言理解推理方法

BriefGPT - AI 论文速递 ·

本文介绍了一种基于粒子马尔可夫蒙特卡罗的新推理方法，适用于复杂控制流的概率编程语言，实验证明其效率优于传统方法。同时开发了Swift推理引擎，提升了运算速度，并提出了新型概率编程框架，增强了推断效率。

混合粒子滤波的推理计划

BriefGPT - AI 论文速递 ·

本文介绍了多种高效的大型语言模型推理方法，如DeepGEMM、QUICK和FLUTE内核，这些方法通过量化和优化策略显著提升了推理速度和吞吐量。在CPU和GPU上实现了高达7倍的延迟降低和27倍的吞吐量提升，同时保持了模型的准确性。

LUT张量核心：查找表实现高效低比特大语言模型推理加速

BriefGPT - AI 论文速递 ·

本文评估了不同在线说话人分离系统的延迟，发现DIART流水线和FS-EEND系统表现优异。讨论了在线说话者辨识的历史、方法及未来挑战，并提出了低延迟语音翻译和说话人匿名化技术，强调了计算效率和实时性在分布式IoT音频网络中的重要性。

优化 DIART 说话者分割流程的推理方法

BriefGPT - AI 论文速递 ·

本文研究了概率语义在描述逻辑知识库中的应用，提出了新的推理方法和查询重写技术，以提高知识库的查询准确性和处理能力。

查询不一致加权知识库的基于成本的语义

BriefGPT - AI 论文速递 ·

DistPred 是一种用于回归和预测任务的新方法，通过使用可微分的离散形式的得分规则，可以在单次前向传递中生成大量样本来估计响应变量的潜在分布，并具有比现有方法更简单且更强大的性能和 90 倍的推理速度。

DistPred：一种无分布的概率推理方法用于回归和预测

BriefGPT - AI 论文速递 ·

本文研究了贝叶斯神经网络（BNNs）中的不确定性估计，提出了改进的近似后验分布和推理方法，克服了传统方法的局限性。实验结果表明，所提方法在模型稀疏性和预测精度上优于普通BNNs，有效样本量可提高50倍。

近似贝叶斯推断中的重参化不变性

BriefGPT - AI 论文速递 ·

本文提出了结构敏感的图形字典嵌入（SS-GDE）、逻辑语法嵌入（LGE）和双重教导方法（DualDE），旨在提高图形分类和知识图谱推理的效率与准确性。研究表明，这些方法在多个数据集上表现优越，显著提升了性能和计算效率。

LGDE：局部基于图的字典扩展

BriefGPT - AI 论文速递 ·