小红花·文摘

本研究提出了一种新颖的架构，通过深核方法优化高斯过程，以解决在不确定性下优化大型语言模型（LLMs）的难题。研究表明，结合LLM基础的深核与高斯过程进行联合优化，显著提高了反应发现率，并在多个基准测试中表现出稳健性和一致性改进。

GOLLuM: Gaussian Process Optimized LLMs - Reframing LLM Fine-tuning through Bayesian Optimization

BriefGPT - AI 论文速递 ·

本研究提出KAN-PnP框架，利用Kolmogorov-Arnold网络进行去噪，解决了传统方法对大规模数据集的依赖。KAN-PnP在超分辨率和联合优化任务中表现优异，且在单次学习中展现出高精度和良好的收敛性。

一次性尝试中的即插即用方法：带有单实例先验

BriefGPT - AI 论文速递 ·

本文提出了一种可微分框架，用于优化接触感知机器人设计，结合变形参数化和可微刚体模拟器。研究展示了“形态创新保护”技术，协同优化机器人结构与控制策略，以提升行为性能。同时，介绍了基于深度强化学习的联合优化方法，适用于软体机器人和硬件设计参数，并展示了其在多种任务中的有效性。

Task2Morph: 基于差异化的任务引发框架的接触感知机器人设计

BriefGPT - AI 论文速递 ·

系统化视觉想象技巧的第一个基准测试（SVIB）引入了新框架，评估模型在潜在世界动态下生成图像转换的能力，为系统感知和想象的联合优化提供了可能性。对SVIB上的基线模型进行了评估，提供了系统化视觉想象技巧的最新发展现状的见解。希望该基准测试有助于推进视觉系统化组合性的发展。

想象无形的世界：一个对视觉世界模型中系统化泛化的基准

BriefGPT - AI 论文速递 ·

本文介绍了一种名为Vision Transformers (ViTs)的模型，使用自我监督学习(SSAT)作为辅助任务与主任务同时进行联合优化，以在有限的数据量下取得更好的性能表现。实验证明了SSAT的显著性提升并减少了碳足迹，同时在视频领域的Deepfake检测上也验证了其普遍适用性。

有限数据，无限潜力：ViT 与遮蔽自编码器增强的研究

BriefGPT - AI 论文速递 ·

该研究提出了一种新的外参标定方法，基于自我监督单目深度和自我运动学习原理，能够高效、安全地完成自我标定。同时，该方法通过联合优化改进深度估计的外参自校准，具有优势。

PseudoCal: 基于深度学习的无初始化相机 - LiDAR 自标定方法

BriefGPT - AI 论文速递 ·

本研究提出了混合模态适应方法（MMA），通过轻量级适配器模块搭建图像和语言模型之间的桥梁，实现联合优化。该方法应用于LaBIn视觉语言指导模型，实验证明其训练效率和性能竞争力优于现有多模LLMs，有潜力成为通用聊天机器人。

多模态大语言模型的位置增强视觉指令调整

BriefGPT - AI 论文速递 ·

该文介绍了一种新颖的多模式机器翻译模型，利用平行的视觉和文本信息，通过视觉注意力锚定机制实现视觉和文本语义的链接，并联合优化视觉-语言嵌入和翻译器。该模型在Multi30K和Ambiguous COCO数据集上取得了有竞争力的结果。作者还收集了一个新的多语言多模态产品描述数据集，用于模拟真实的国际在线购物场景，该模型在该数据集上的视觉注意力锚定模型表现出优异性能。

多模态预训练模型用于顺序决策：综合、验证、基础和感知

BriefGPT - AI 论文速递 ·