小红花·文摘

本研究提出了一种“可靠性保障的变换器”（RT）算法，旨在解决离线强化学习中的不可靠轨迹问题。RT算法通过计算轨迹的累计可靠性，生成高回报轨迹，并在多个基准任务中表现出优越性。

Model-Based Offline Reinforcement Learning and Reliability-Assured Sequence Modeling

BriefGPT - AI 论文速递 ·

本研究提出了一种集体蒙特卡罗树搜索（CoMCTS）方法，以提高多模型大语言模型（MLLM）的推理效率。实验结果显示，基于CoMCTS训练的Mulberry模型在基准任务中表现优异，具有良好的应用前景。

Mulberry: Empowering MLLM for O1-Level Reasoning and Reflection through Collective Monte Carlo Tree Search

BriefGPT - AI 论文速递 ·

本研究提出了一种新型预训练策略，强调氨基酸残基间的相互作用，提升了从序列数据中提取共演化特征的能力。实验结果表明，该模型在多个基准任务中表现优异，标志着蛋白质序列建模的重大进展。

SFM-Protein with Integrated Co-evolution Pre-training: Advanced Protein Sequence Representation

BriefGPT - AI 论文速递 ·

突破内存限制：通过近无限批量大小提升对比学习

DEV Community ·

本文介绍了一个基于汽车激光雷达的大型数据集，旨在推动激光语义分割研究。作者提出了三项基准任务，展示了需要更复杂模型来处理这些任务。该数据集为新方法开发和研究方向提供了丰富的数据，促进了语义场景补全技术的进步。

DiffSSC：使用去噪扩散概率模型进行语义LiDAR扫描完整性填充

BriefGPT - AI 论文速递 ·

本文介绍了Qwen-Audio模型，旨在提升音频理解能力，覆盖30多项任务和多种音频类型。通过多任务训练框架，Qwen-Audio在多个基准任务中表现优异，且无需特定任务微调。此外，基于此模型开发了Qwen-Audio-Chat，实现多轮对话，支持多种音频场景。

通过使用模型模拟，摊销贝叶斯推理训练神经网络以解决随机推理问题。提出了一种新的摊销推理方法Simformer，克服了当前模拟为基础的摊销推理方法的局限性，且在基准任务上优于当前最先进的摊销推理方法。具有更大的灵活性，可以应用于具有函数值参数的模型，处理具有缺失或非结构化数据的推理场景，并能够采样参数和数据的任意条件联合分布。在生态学、流行病学和神经科学的模拟器上展示了Simformer的性能和灵活性，并证明了它的新的可能性和应用领域。

基于模拟的一体化推论

BriefGPT - AI 论文速递 ·

本研究介绍了一种新的基于图形的分子数据自我监督学习方法MGSSL，通过自生成基元的预训练框架，捕获分子图中的丰富信息，并在下游基准任务中表现优于最先进的基线。

基于图结构学习的分子属性预测

BriefGPT - AI 论文速递 ·

该研究提出了新的评估基准，用于评估 AQG 系统在长文本答案下的性能。变压器模型在长答案方面表现优于其他 AQG 方法，但仍存在性能下降的情况。长答案 QA 是未来研究的具有挑战性的基准任务。

探索 LLMs 对长文问题回答的可行性

BriefGPT - AI 论文速递 ·

Model-Based Offline Reinforcement Learning and Reliability-Assured Sequence Modeling

Mulberry: Empowering MLLM for O1-Level Reasoning and Reflection through Collective Monte Carlo Tree Search

SFM-Protein with Integrated Co-evolution Pre-training: Advanced Protein Sequence Representation

突破内存限制：通过近无限批量大小提升对比学习

DiffSSC：使用去噪扩散概率模型进行语义LiDAR扫描完整性填充

Qwen2-Audio 技术报告

基于模拟的一体化推论

基于图结构学习的分子属性预测

探索 LLMs 对长文问题回答的可行性