小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
刚刚,全球视频模型新王诞生了!

天工AI的SkyReels-V4视频模型近期在全球榜单中领先,超越Veo 3.1和Sora 2。此次升级显著提升了视频生成的逻辑性和可控性,支持关键帧和网格参考功能,推动视频生成进入工业化时代。SkyReels-V4强调多模态融合,提升生成质量和效率,适用于短剧等内容生产。

刚刚,全球视频模型新王诞生了!

量子位
量子位 · 2026-03-19T06:55:36Z
谷歌DeepMind CEO Hassabis对未来12个月的的预测 - 蝈蝈俊

谷歌DeepMind CEO Hassabis预测,未来12个月AI将实现多模态融合、类人视觉智能、语言与视频深度结合、世界模型主流化及智能体可靠应用,推动AI从实验工具转向日常生活助手。

谷歌DeepMind CEO Hassabis对未来12个月的的预测 - 蝈蝈俊

蝈蝈俊
蝈蝈俊 · 2025-12-12T07:26:00Z

文心大模型在推理能力评估中获得“4+级”评级,展现出优异的多模态融合和深度思考能力。通过自反馈增强技术和飞桨框架优化训练效率,百度推动其在教育、代码和数字人等领域的应用,显示出强大的技术优势和市场潜力。

一场对话,我们细扒了下文心大模型背后的技术

量子位
量子位 · 2025-05-22T12:57:08Z
计算机视觉的最新进展:多模态融合、鲁棒性与跨领域的可扩展智能

本文讨论了2025年5月12日发布的十六篇计算机视觉研究论文,涉及多模态融合、鲁棒性、效率、医疗应用和生成模型等主题。计算机视觉旨在使机器理解视觉信息,推动自动驾驶和医疗诊断等领域的发展。研究表明,集成多种数据、提升模型鲁棒性和效率是当前主要挑战,未来将关注生成模型的伦理问题及其在医疗中的应用。

计算机视觉的最新进展:多模态融合、鲁棒性与跨领域的可扩展智能

DEV Community
DEV Community · 2025-05-15T07:33:33Z

本文提出CM3AE预训练框架,旨在解决事件数据与RGB帧之间的联系不足问题。通过多模态融合重建模块和对比学习策略,增强了跨模态理解能力。实验结果表明,该方法在多项任务中表现优异。

CM3AE: A Unified RGB Frame and Event-Voxel/Frame Pre-training Framework

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-17T00:00:00Z

本研究提出了一种名为MASTER的多模态融合模型,能够在复杂天气和光照条件下有效提取RGB与热成像数据的信息,展现出优异性能,具有广泛应用潜力。

MASTER: Text-Prompted Multimodal Segmentation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-06T00:00:00Z

本研究提出了一种名为PedCA-FT的新框架,旨在早期预测儿童心脏骤停,结合电子健康记录的表格和文本视图,表现优于其他人工智能模型,展示了多模态融合技术的潜力。

基于多模态融合变换器的儿童心脏骤停早期风险预测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-11T00:00:00Z
昆仑万维「天工4.0」携超强o1/4o霸气上线!强推理+实时语音,免费无限体验

前OpenAI首席科学家Ilya Sutskever在NeurIPS大会上预测,预训练时代将结束,未来将更注重推理能力。国内公司昆仑万维推出Skywork o1和Skywork 4o模型,强调推理和多模态融合。Skywork o1在数学和代码推理上表现优异,采用分步推理和强化学习;Skywork 4o则具备语音对话中的情感识别能力,提供自然互动体验。

昆仑万维「天工4.0」携超强o1/4o霸气上线!强推理+实时语音,免费无限体验

机器之心
机器之心 · 2025-01-06T05:01:12Z

本文介绍了深度伪造音频检测模型的研究进展,包括基于深度学习的音频数据集、MFAAN网络、实时检测模型和多模态融合方法。这些研究提高了伪音频检测的准确性,展示了在动态通信场景中确保音频安全的潜力。

音频不会说谎:用于音频深度伪造检测的多频通道注意机制

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z

本研究构建了元素属性知识图谱,并提出了多模态融合框架ESNet,将元素属性与晶体结构特征结合。实验结果表明,该方法在带隙预测中表现优异,显著提升了晶体材料性能预测的准确性和全面性。

Material Property Prediction Based on Element Attribute Knowledge Graphs and Multimodal Representation Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-13T00:00:00Z

该论文探讨了自动驾驶中的高精度3D物体检测,提出了Multi-View 3D网络(MV3D)框架,结合LIDAR和RGB图像进行检测。研究表明,该方法在3D定位和检测上优于现有技术约25%和30%。此外,文中介绍了多模态融合技术及其在复杂环境中的应用,提出了新算法和数据集,以提升自动驾驶的感知能力和准确性。

Kaninfradet3D:基于非线性特征提取和内在相关性的路侧相机-激光雷达融合3D感知模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-21T00:00:00Z

本文介绍了自适应空间特征融合(ASFF)在目标检测中的应用,提升了特征的尺度不变性。结合YOLOv3在MS COCO数据集上实现了最佳速度与精度平衡。同时,研究了多模态融合技术及其在不同环境下的鲁棒性,提出了新框架BiCo-Fusion和ProFusion3D,增强了3D目标检测的性能和稳定性。

茧:具有不确定性感知的强健多模态传感器融合

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z

本文介绍了多个司机监控数据集及其应用,提出了一种高效的司机行为识别系统,强调实时反应和精度。研究了多模态融合策略,结合可穿戴生理测量和多视角数据集,以提升驾驶员状态监测,并探讨了低质量数据的多模态融合挑战,提出未来研究方向。

IC3M:用于监测驾驶员和乘客异常状态的车内多模态多目标监测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

本文介绍了一种名为Pathomic Fusion的多模态融合策略,结合组织学图像和基因组特征,以提高癌症患者生存预测的准确性。通过深度学习和自我监督学习,提出了互相引导的跨模态转换器(MGCT),在不同癌症数据集上表现优越,增强了模型的鲁棒性和普适性,克服了传统方法的局限性。

UNICORN: 一种用于整合多染色数据的深度学习模型在组织病理学中的应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-26T00:00:00Z

本文综述了视频质量评估的最新研究进展,包括高帧率视频的盲评估模型FAVER、UGC直播视频质量数据库及评估工具、全向视频质量评估方法等。研究表明,多模态融合策略和深度强化学习算法能有效提升视频质量预测的准确性和能效。

实时视频流的主观和客观体验质量评估研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-26T00:00:00Z

本文介绍了一种新的视频问答(VideoQA)框架,结合异构内存和多模态融合层,通过自我更新的注意力实现多步推理,提升了在多个基准数据集上的性能。同时,提出了新的数据集和模型,以改善长视频的理解和推理能力,推动视频问答研究的发展。

自上而下的活动表征学习用于视频问答

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-12T00:00:00Z

本文介绍了无人机和高光谱成像技术的研究进展,包括单目视觉控制、实时高光谱目标跟踪、3D重建、图像校正、合成高光谱数据集、地图算法评估及高光谱图像修复,强调了多模态融合和自监督学习在提升成像和地图绘制性能中的重要性。

轻型空中推扫成像光谱仪的飞行校正方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-10T00:00:00Z

本研究探讨了深度学习和因果贝叶斯网络在顾客流失预测中的应用,提出了多模态融合学习模型,显著提高了预测准确率。同时分析了混淆变量对流失的影响,强调了机器学习在推荐系统中的重要性,并提出因果机器学习在供应链管理中的应用,以改善决策和风险管理。

大规模双重机器学习预测客户行为的因果影响

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-03T00:00:00Z

本文介绍了多个自动驾驶数据集,包括nuTonomy场景数据集、A*3D数据集和V2V4Real多模态数据集。这些数据集提供丰富的传感器数据,支持3D物体检测和跟踪,旨在提升自动驾驶技术的性能和鲁棒性。同时,研究探讨了多模态融合方法及其实际应用优势。

RoboSense:多传感器低速自动驾驶的大规模数据集和基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-28T00:00:00Z

该论文探讨了自动驾驶中的高精度3D物体检测,提出了多视角3D网络(MV3D)框架,结合LIDAR和RGB图像,显著提升了3D定位和检测性能。此外,研究介绍了多模态融合网络FBMNet和开放词汇检测框架OpenSight,均在nuScenes数据集上表现优异,为自动驾驶安全提供了有效解决方案。

BOX3D:用于3D物体检测和定位的轻量级相机-激光雷达融合

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-27T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码