语言智能体旨在通过自身经验学习超越人类,但目前依赖专家数据微调,导致扩展性和泛化能力不足。Meta提出“早期经验”范式,通过智能体自身行为生成交互数据,作为监督信号,促进强化学习与模仿学习的结合。
本章探讨智能代理的高级推理方法,强调多步骤逻辑推理和问题解决。通过分解问题和增加计算资源,代理能够更准确地解决复杂问答、数学问题、代码调试和战略规划等实际应用。这些方法提高了代理的准确性和可靠性,推动了自主智能体的发展。
本研究针对机器学习服务中的隐私问题,提出了一种基于密码技术的私密变压器推理方法,以保护用户数据和模型隐私,并回顾了相关进展与挑战。研究表明,该方法能有效平衡资源效率与隐私保护。
本研究提出了ZeroTIR工具集成推理方法,以解决大型语言模型在数学推理中的计算精度不足问题。研究表明,强化学习训练的进展与自发代码执行频率、响应长度和任务准确率之间存在显著正相关,揭示了计算努力与工具辅助推理策略的关系。
研究论文《DeepDistill》提出了一种新方法,通过构建大型分级推理数据集,显著提升大语言模型(LLM)的推理能力。研究发现,推理训练需要更高的学习率,最终在AIME2024基准测试中实现79.2%的通过率,接近最先进水平。
本文解决了现有视觉语言模型(VLMs)在对抗鲁棒性和幻觉减缓方面的不足,提出了一种名为Hydra的自适应代理框架。Hydra通过迭代推理和结构化评估,显著提高了模型在面对对抗扰动和模型内在错误时的稳健性,并在多项基准测试中表现超越传统方法,展现出在现实应用中提升VLM可靠性的潜力。
本研究提出了一种新颖的推理方法,针对大语言模型在推理计算中的效率问题。通过优化Mamba模型,尽管零样本性能有所下降,但在固定计算预算下,其在数学推理数据集上的覆盖率和准确性优于变换器教师模型,为推理计算的扩展提供了新方向。
本文提出了一种新颖的推理方法——选项流(FoO),旨在解决大型语言模型的内在偏差问题。FoO能够系统性地探讨多种推理可能性,理论验证显示其在机器学习任务中提升了38.2%-69.2%,具有广泛的适用性和成本效益。
本研究针对绿色建筑设计决策中的知识广泛性和低效问题,创新性地将大型语言模型与决策支持结合,开发了GreenQA问答框架,能够实现多模态数据推理。研究表明,使用GreenQA平台的用户中有96%的人认为它有效提升了设计效率,为人工智能辅助设计提供新的灵感。
本研究探讨了多模态大型语言模型在复杂环境中的规划能力不足,提出了EgoPlan-Bench2基准测试,涵盖24个日常场景,并提出了一种无训练的多模态推理方法,以提升模型的规划能力。
本文提出了一种新算法——分阶段投机性解码,旨在加速小批量大型语言模型(LLM)的推断。该方法通过重组投机性批量为树结构并增加第二阶段解码,成功将解码延迟降低了3.16倍,同时保持输出质量。此外,研究还探讨了推测解码的训练方法,显著提高了模型的效率和性能。
本文提出了一种高效的大语言模型推理方法,通过序列调度技术实现86%的推理吞吐量提升。研究分析了LLM推理技术的瓶颈,探讨了优化策略和未来研究方向,强调了在资源有限环境中提升性能的潜力。
本文介绍了多种地理语言模型的创新,如SpaBERT、GeoGLUE、GeoNorm和GeoLLM,强调它们在地理实体识别、链接和空间推理等任务中的显著性能提升。这些模型结合了空间坐标嵌入和大型语言模型的优势,推动了地理空间决策与自然语言处理的融合,展现了在地理数据理解和应用中的潜力。
本文介绍了一种基于粒子马尔可夫蒙特卡罗的新推理方法,适用于复杂控制流的概率编程语言,实验证明其效率优于传统方法。同时开发了Swift推理引擎,提升了运算速度,并提出了新型概率编程框架,增强了推断效率。
本文介绍了多种高效的大型语言模型推理方法,如DeepGEMM、QUICK和FLUTE内核,这些方法通过量化和优化策略显著提升了推理速度和吞吐量。在CPU和GPU上实现了高达7倍的延迟降低和27倍的吞吐量提升,同时保持了模型的准确性。
本文评估了不同在线说话人分离系统的延迟,发现DIART流水线和FS-EEND系统表现优异。讨论了在线说话者辨识的历史、方法及未来挑战,并提出了低延迟语音翻译和说话人匿名化技术,强调了计算效率和实时性在分布式IoT音频网络中的重要性。
本文研究了概率语义在描述逻辑知识库中的应用,提出了新的推理方法和查询重写技术,以提高知识库的查询准确性和处理能力。
DistPred 是一种用于回归和预测任务的新方法,通过使用可微分的离散形式的得分规则,可以在单次前向传递中生成大量样本来估计响应变量的潜在分布,并具有比现有方法更简单且更强大的性能和 90 倍的推理速度。
本文研究了贝叶斯神经网络(BNNs)中的不确定性估计,提出了改进的近似后验分布和推理方法,克服了传统方法的局限性。实验结果表明,所提方法在模型稀疏性和预测精度上优于普通BNNs,有效样本量可提高50倍。
本文介绍了如何通过整合贝叶斯学习框架来量化神经普通微分方程中权重的不确定性,并展示了在MNIST数据集上使用GPU加速的推理方法的实验结果。同时,证明了变分推理与标准化流和神经ODE的成功整合,生成了强大的贝叶斯神经ODE对象。最后,演示了如何利用常微分方程概率地识别动力系统中的模型规范,为探索认识上的不确定性提供了科学的机器学习工具。
完成下面两步后,将自动完成登录并继续当前操作。