小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文提出CM3AE预训练框架,旨在解决事件数据与RGB帧之间的联系不足问题。通过多模态融合重建模块和对比学习策略,增强了跨模态理解能力。实验结果表明,该方法在多项任务中表现优异。

CM3AE: A Unified RGB Frame and Event-Voxel/Frame Pre-training Framework

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-17T00:00:00Z

本研究提出了一种新的时间事件预训练框架,解决了3D医学成像模型在捕捉疾病相关生物标志物时缺乏时间上下文的问题。通过利用纵向电子健康记录进行大规模时间监督,显著提升了8个基准任务的预测性能。

Temporal Event Pretraining for 3D Medical Imaging

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-14T00:00:00Z

本研究提出了课程掩蔽(CurrMask)预训练框架,旨在解决离线强化学习中技能学习的复杂度平衡问题,通过动态调整掩蔽方案,提升不同复杂度技能的学习效果。

通过课程掩蔽学习多样化技能

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-23T00:00:00Z

本文介绍了DiffCLIP,一种新的预训练框架,结合稳定扩散和ControlNet,减小视觉分支中的域间差异,并引入样式提示生成模块,用于少样本任务。实验结果显示DiffCLIP在ModelNet10、ModelNet40和ScanObjectNN数据集上具有强大的3D理解能力。在ScanObjectNN的OBJ_BG数据集上,DiffCLIP实现了43.2%的零样本分类精度,是最先进的技术水平;在ModelNet10上实现了80.6%的零样本分类精度,与最先进的技术水平相当。

基于 CLIP 的点云分类:通过点云到图像的转换

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-07T00:00:00Z

VaLM是一种预训练框架,通过视觉增强语言建模,提高多模态语言建模的性能。VaLM在常识推理任务中表现优秀,特别是在颜色、大小和形状方面。

BACON:利用概念图强化虚拟生命模型以减少幻觉

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-03T00:00:00Z

提出了一种新颖的预训练框架,构建了适用于图像质量评估的通用表示。方法在多个数据集上取得了最先进的性能,并展现了显著的泛化能力。

CLIP 引导属性感知预训练用于可泛化图像质量评估

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-03T00:00:00Z

VaLM是一种预训练框架,通过视觉增强语言建模提高多模态语言建模性能。VaLM在常识推理任务中表现出色,优于强语言和视觉语言基线。

层次化多模态预训练以理解视觉丰富的网页

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-28T00:00:00Z

VaLM是一种预训练框架,通过视觉增强语言建模,提高多模态语言建模的性能。VaLM在常识推理任务中表现出色,优于强语言和视觉语言基线。

评估视觉语言模型的图像评论能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-19T00:00:00Z

本研究介绍了一种新的基于图形的分子数据自我监督学习方法MGSSL,通过自生成基元的预训练框架,捕获分子图中的丰富信息,并在下游基准任务中表现优于最先进的基线。

基于图结构学习的分子属性预测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-28T00:00:00Z

利用多模态信息的视觉语言预训练(VLP)在自然领域的视觉识别和胸部 X 射线(CXR)的医学影像诊断方面取得了重大成功。UniChest是一个征服与分割的预训练框架,旨在充分利用多个源 CXRs 的协作优势,同时减少源异质性的负面影响。

UniChest: 多源胸部 X 射线分级的征服和分割预训练

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-18T00:00:00Z

VaLM是一种预训练框架,使用视觉增强语言建模,结合图像检索模块和视觉知识融合层,可以参考文本和图像的视觉知识进行多模态语言建模。在常识推理任务中表现出色,颜色、大小和形状方面的性能优于强语言和视觉语言基线。

HallusionBench: 视觉与图像上下文推理基准测试,对 GPT-4V (ision),LLaVA-1.5 和其他多模态模型构成挑战

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-23T00:00:00Z

本文介绍了一种新的预训练框架DiffCLIP,用于减小视觉分支中的域间差异,并引入样式提示生成模块,用于少样本任务。在多个数据集上进行实验,表明DiffCLIP具有强大的3D理解能力,特别是在零样本分类方面表现出色。

稳定扩散对三维场景了解多少?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-10T00:00:00Z

该研究提出了一种名为MGSSL的基于图形的自我监督学习方法,用于分子数据。他们使用自生成基元的预训练框架来捕获分子图中的信息,并在不同的下游基准任务上进行了广泛实验,表明该方法优于所有最先进的基线。

基于片段的分子图预训练与微调

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-05T00:00:00Z

VaLM是一种预训练框架,使用视觉增强语言建模,通过图像检索模块检索相应图像,并使用视觉知识融合层使多模态语言建模可以参考文本和图像的视觉知识。VaLM在常识推理任务中表现出色,包括颜色、大小和形状方面的性能优于强语言和视觉语言基线。

ReForm-Eval: 通过任务导向基准的统一重新制定评估大型视觉语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-04T00:00:00Z

该研究提出了一种名为MGSSL的基于图形的分子数据自我监督学习方法,使用自生成基元的预训练框架来捕获分子图信息,并在不同的下游基准任务上进行了广泛实验,表明其优于所有最先进的基线。

MHG-GNN:分子超图语法与图神经网络的组合

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-28T00:00:00Z

VaLM是一种预训练框架,使用视觉增强语言建模,结合图像检索模块和视觉知识融合层,可以参考文本和图像的视觉知识。在常识推理任务中表现出色,颜色、大小和形状方面的性能优于强语言和视觉语言基线。

无需进一步训练的预训练基础模型应对 VQA

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-27T00:00:00Z

DFormer是一种创新的RGB-D预训练框架,使用一系列RGB-D块进行编码,避免了现有方法中RGB预训练的主干网络对深度图中的三维几何关系进行不匹配的编码问题。使用轻量级的解码器头微调预训练的DFormer,在两个RGB-D分割数据集和五个RGB-D显着性数据集上实现了最新的最佳性能,代价为当前最佳方法的一半。

RoadFormer:RGB-Normal 语义道路场景解析的双工变换器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-19T00:00:00Z

本文介绍了一种名为PANDA的预训练框架,用于解决预训练视觉语言模型在视觉和语言导航任务中的领域差异和交叉模态对齐的问题。通过对比学习,PANDA在R2R和REVERIE任务上取得了优于之前方法的结果。

基于提示的上下文和领域感知预训练:视觉与语言导航

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-07T00:00:00Z

VaLM是一种预训练框架,使用图像检索模块和视觉知识融合层进行多模态语言建模。通过常识推理任务评估,显示VaLM在颜色、大小和形状方面的性能优于强语言和视觉语言基线。

不需重训练的扩展冻结视觉 - 语言模型:朝着改进机器人感知能力迈进

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-31T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码