小红花·文摘

本研究提出了一种无训练的冲突感知任务合并（CAT合并）方法，旨在解决多任务模型合并中的知识冲突问题。通过剔除冲突组件，CAT合并在视觉、语言和视觉-语言任务上有效提升了准确率，平均提高2.5%和2.0%。

CAT Merging: A Training-Free Approach to Resolving Conflicts in Model Merging

BriefGPT - AI 论文速递 ·

4K分辨率视觉预训练首次实现！伯克利&英伟达多模态新SOTA，更准且3倍加速处理

机器之心 ·

RFT强化微调结合强化学习与传统微调，能在特定领域显著提升大语言模型表现。华为云ModelArts Studio支持该技术，优化医疗模型，实验显示准确率提升超过10%。此方法降低数据需求，适应性强，适合数据稀缺行业。

医疗场景实战：百条数据 RFT 微调盘古大模型，精度大幅提升

华为云官方博客 ·

本研究提出了一种基于大型语言模型（LLMs）的网络攻击检测方法，旨在提高恶意流量分类的准确性。研究表明，LLMs可作为分类器、编码器和预测器，通过并行建模，DDoS检测的准确率提升近35%。

Network Attack Detection Based on Large Language Models: Architecture, Opportunities, and Case Studies

BriefGPT - AI 论文速递 ·

本研究提出了“物理推理器”框架，以解决大型语言模型在物理问题上的知识不足。该框架通过构建公式集和核对清单，提升了模型在分析、检索和推理阶段的能力，最终在SciBench上实现了平均5.8%的准确率提升。

物理推理器：知识增强推理用于解决物理问题的大型语言模型

BriefGPT - AI 论文速递 ·

该研究使用瞳孔测量的虚拟现实情绪识别方法，通过分析虚拟现实头戴设备对视觉和听觉刺激的瞳孔直径响应，提取关键特征并应用集成学习技术，将准确率从84.9%提升至98.8%。研究结果为进一步发展沉浸式交互虚拟现实环境以及虚拟触觉技术打开了新的可能性。

通过交互式虚拟现实游戏在复合空间中探索情绪

BriefGPT - AI 论文速递 ·

通过研究神经切向核（NTK），设计了一种元学习机制，提高了网络的基础泛化能力。综合多种方法，网络在FSCIL基准数据集上的准确率提升了2.9%至8.7%。

NTK 引导下的少样本类别增量学习

BriefGPT - AI 论文速递 ·

研究者发现，大多数语言模型生成的对话摘要中有27%的事实不一致。对于更具挑战性的事实问题回答，所有模型的平均准确率仅为62.8%。研究还发现，对话的主题/客体的理解是语言模型对话理解能力中最困难的问题。通过自动构建多任务数据进行微调，可以提高模型的对话理解能力。在DIAC-FactQA上，该方法获得了8.9%的准确率提升。