小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
SlowFast-LLaVA-1.5:一种高效的长视频理解视频大语言模型家族

本文介绍了SlowFast-LLaVA-1.5(SF-LLaVA-1.5),一种高效的视频大语言模型,专注于长视频理解。该模型结合了SlowFast机制和联合视频-图像训练,在1B和3B规模下表现出色,满足移动友好模型的需求。实验结果显示,SF-LLaVA-1.5在多个视频任务上表现优异,尤其在长视频理解方面达到了最先进水平。

SlowFast-LLaVA-1.5:一种高效的长视频理解视频大语言模型家族

Apple Machine Learning Research
Apple Machine Learning Research · 2025-08-22T00:00:00Z

本文探讨了通过知识隔离和联合训练提升视觉-语言-动作模型(VLA)性能的方法。研究表明,传统训练方法导致知识损失和推理速度慢。作者提出的知识隔离技术有效保护预训练模型知识,同时使模型适应机器人控制任务,从而加快训练和推理速度。

π0.5的KI改进版——知识隔离:让VLM在不受动作专家负反馈的同时,输出离散动作token,并根据反馈做微调(而非冻结VLM)

结构之法 算法之道
结构之法 算法之道 · 2025-07-10T04:18:12Z

本研究提出了一种结合不平衡感知技术的联合训练基准,以解决少样本增量学习中的类别不平衡问题,缩小基础类与增量类的性能差距,并规范了实验设置与评估流程。

针对少样本增量学习的新基准:重新定义上限

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-13T00:00:00Z

本研究提出了一种两阶段通用策略框架,结合扩散规划者和逆动力学模型,以解决智能体在多种决策任务中的适应性问题。实验结果显示,联合训练不同智能体的数据集可提高任务完成精度,最高提升42.20%。

Universalizing Generalist Policies

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-20T00:00:00Z

本研究提出了一种教师与学生联合训练框架,解决了在特权模仿学习中学生因部分可观测性而无法有效模仿教师的问题。实验结果表明,该方法在复杂的四旋翼任务中表现显著。

Teacher Training Based on Student Feedback

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z

本研究提出了一种新颖的联合训练方法,解决了选择性预测中模型输出信任度不足的问题。结果表明,该方法在预测结果和模块性能上均优于两个强基线。

Joint Training for Selective Prediction

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

本文研究了低资源语言中的视觉关键词检测,提出了多种模型和方法,包括视觉语音联合训练和基于注意力机制的模型,以提高关键词定位精度。研究表明,结合高资源语言知识可以有效提升低资源语言的表现,并探讨了在真实环境中的应用挑战。

在真实低资源环境中改进视觉提示关键词定位

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-09T00:00:00Z

本文介绍了一种联合训练的多器官分割模型,利用少量器官数据集和软标签减少噪声,实验结果表明其性能优于现有方法。此外,研究探讨了自我监督学习和对比学习在医学成像中的应用,提出了多教师单学生知识蒸馏框架和新损失函数,显著提升了分割任务的效果。

多器官分割中部分标记数据集之间的深度互相学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-17T00:00:00Z
利用多样化建模单元增强基于CTC的语音识别

近年来,端到端(E2E)自动语音识别(ASR)模型在深度学习架构的推动下取得了显著进展。研究者通过与音素模型的联合训练,显著提高了模型的准确性。本文提出了一种高效的联合训练方法,利用多样化建模单元,进一步增强了模型的准确性,为开发更强大的ASR系统提供了新思路。

利用多样化建模单元增强基于CTC的语音识别

Apple Machine Learning Research
Apple Machine Learning Research · 2024-07-12T00:00:00Z

通过融合不同数据集和先进的表示学习模型,研究遥感图像中建筑物的识别和分割。创新联合训练过程展示了方法的价值,并为未来的探索奠定了基础。显示了建筑物分割领域中创新应用的潜在前景。

利用多模态遥感数据在大规模城市区域中识别每个建筑物的功能

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-08T00:00:00Z

通过融合不同数据集和先进的表示学习模型,研究在遥感图像中对建筑物进行识别和分割。创新联合训练过程在城市规划、灾害管理和环境监测等领域展示了方法的价值。结果为未来的探索奠定了基础,并显示了在建筑物分割领域中的潜在前景。

RSBuilding: 通向通用遥感图像建筑目标提取和变化检测的基础模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-12T00:00:00Z

本文介绍了RoSA,一种新型参数高效调整方法,通过联合训练低秩和高度稀疏的组件,有效逼近全精调解决方案的性能。RoSA在挑战性生成任务中表现优于LoRA和纯稀疏调整,且具备高效训练的内存和计算支持。

RoSA:鲁棒适应实现准确的参数高效微调

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-09T00:00:00Z

该研究提出了一种新型混合动作基元架构和联合训练方法,实现了在小语料库中从语音到手语的翻译。相较于从原始手语表现形式到手语的翻译,完整的从口语到手语的翻译流水线表现更好。

SignAvatars:大规模 3D 手语整体运动数据集与基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-31T00:00:00Z

该文介绍了DiffPrompter,一种新颖的可微分的视觉和潜在提示机制,用于自动驾驶系统中的恶劣天气场景的语义分割任务。作者证明了该方法在物体分割任务中的有效性和优越性,并研究了联合训练视觉和潜在提示的优势。

DiffPrompter:用于困难条件下语义分割的可微隐式视觉提示

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-06T00:00:00Z

该论文提出了一种评估口头表达一致性的方法,通过联合训练多种任务的模型,提高了评估一致性的性能,为大规模自动评估提供了基础。

自动一致性评估的新型计算和建模基础

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-01T00:00:00Z

该研究提出了一种联合训练方案,包括可微分的DPR集成答案生成,以端到端的方式进行训练。实验表明,该方案优于最近的OK-VQA系统。同时,引入了新的诊断指标来分析检索和生成之间的交互作用,模型的强大检索能力显着降低了训练所需的检索文档数量,从而在答案质量和训练所需的计算方面产生了显着的收益。

细粒度迟期交互多模态检索用于检索增强视觉问答

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-29T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码