小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate
ICLR 2026 | 火山引擎多媒体实验室提出GenDR, 探索扩散模型超分落地难题

扩散模型在图像生成方面取得了重要进展,但由于推理步骤多和分辨率限制,实际应用受到制约。为提高效率和图像保真度,提出了GenDR和GenDR-Pix模型,优化了VAE和UNet,支持高分辨率图像处理,增强了细节恢复效果,推动生成技术与实际业务的结合。

ICLR 2026 | 火山引擎多媒体实验室提出GenDR, 探索扩散模型超分落地难题

实时互动网
实时互动网 · 2026-03-04T06:39:12Z
GStreamer 1.28开源多媒体框架发布,新增支持Vulkan H.264编码器等多项功能

GStreamer 1.28 发布,新增 Vulkan H.264 编码器、AMD HIP 插件和 Wayland 支持。引入 Rust 编写的音频源分离、YOLOX 推理元素及 GIF 解码器,增强分析 API 和 MP4 解复用支持,同时改进日志管理和管道图支持。

GStreamer 1.28开源多媒体框架发布,新增支持Vulkan H.264编码器等多项功能

实时互动网
实时互动网 · 2026-01-28T02:41:56Z
火山引擎多媒体实验室 AIGC 视频画质理解大模型 VQ-Insight 入选 AAAI 2025 Oral

AAAI 2026会议共录用4167篇论文,录取率为17.6%。火山引擎与北大合作的VQ-Insight论文获口头报告,提出了一种基于强化学习的视频质量理解方法,显著提升了AIGC视频生成质量,具备良好的泛化能力和解释性。

火山引擎多媒体实验室 AIGC 视频画质理解大模型 VQ-Insight 入选 AAAI 2025 Oral

实时互动网
实时互动网 · 2025-11-26T09:58:25Z
火山引擎多媒体实验室画质理解大模型 Q-Insight 入选 NeurIPS 2025 Spotlight

NeurIPS 2025公布了5290篇论文录用结果,其中火山引擎与北大合作的Q-Insight被评为亮点文章。Q-Insight通过强化学习优化图像质量,超越传统方法,展现出卓越的准确性和泛化能力,推动音视频技术发展。

火山引擎多媒体实验室画质理解大模型 Q-Insight 入选 NeurIPS 2025 Spotlight

实时互动网
实时互动网 · 2025-10-22T09:23:03Z
火山引擎多媒体实验室联合南开大学推出TempSamp-R1强化学习新框架,视频时序理解大模型SOTA!

视频时序定位是视频理解的关键任务,旨在根据自然语言查询精确定位视频片段。火山引擎与南开大学联合研发的TempSamp-R1框架,通过创新的混合策略采样、非线性优势塑造和混合CoT训练,显著提升了视频时序定位的效率和精度,已在多个数据集上刷新记录,推动智能剪辑技术的发展。

火山引擎多媒体实验室联合南开大学推出TempSamp-R1强化学习新框架,视频时序理解大模型SOTA!

实时互动网
实时互动网 · 2025-10-21T09:48:06Z
火山引擎多媒体实验室重要突破!LiveGS 技术登榜 SIGGRAPH,重新定义移动端自由视角视频直播

火山引擎多媒体实验室的LiveGS技术成功实现移动端实时自由视角视频直播,解决了高计算负载和带宽需求问题。该技术将在2025年SIGGRAPH展出,应用于体育直播和虚拟演出等场景,提升用户体验。

火山引擎多媒体实验室重要突破!LiveGS 技术登榜 SIGGRAPH,重新定义移动端自由视角视频直播

实时互动网
实时互动网 · 2025-09-11T09:31:01Z
我的认知突围:从文字信徒到多媒体拥趸?

每个人的成见如同大山。作为老博主,我曾偏爱文字,但短视频的流行挑战了传统。现代技术提高了视频信息处理效率,未来可能实现多感官信息传递。我们应更新观念,勇敢迎接变化。

我的认知突围:从文字信徒到多媒体拥趸?

土木坛子
土木坛子 · 2025-03-30T16:00:25Z
多媒体 Elixir 开发人员实用指南

Elixir 是构建分布式多媒体应用的理想语言,基于 Erlang。Membrane 适合复杂的多媒体管道,Boombox 简化流媒体任务。Xav 用于音视频编码,Image 和 Vix 处理静态图像,Nx 支持机器学习,Elixir WebRTC 实现实时音视频交换。了解这些库的特点有助于开发多媒体应用。

多媒体 Elixir 开发人员实用指南

实时互动网
实时互动网 · 2025-03-03T07:09:27Z
我学习HTML ID和类、多媒体、SVG、Iframe及各种实体和标签的旅程 🚀(第5天)

HTML是网站的基础,学习ID、类、嵌入多媒体和语义标签等概念。ID用于唯一标识元素,类确保样式一致性。多媒体提升用户体验,SVG图像保持高质量。语义标签改善网页结构和可读性,HTML实体用于显示特殊字符。这些知识有助于创建结构良好、可访问的网站。

我学习HTML ID和类、多媒体、SVG、Iframe及各种实体和标签的旅程 🚀(第5天)

DEV Community
DEV Community · 2025-02-01T04:39:13Z
多媒体和动画的范围是什么?

动画和多媒体领域涵盖娱乐、教育、广告、医疗、建筑和网页设计等多个行业。随着技术进步,虚拟现实和增强现实等新领域对专业人才的需求增加。相关学位和实践经验有助于在该行业取得成功。

多媒体和动画的范围是什么?

DEV Community
DEV Community · 2025-01-13T14:10:23Z

本研究解决了多媒体文档摘要中的信息提取和结构完整性维护等复杂问题。提出了一种新颖的修辞结构框架,通过图形表示和加权算法,有效提取关键信息,并满足用户的个性化需求。研究表明,该框架在自动化摘要领域具有重大进展和广泛应用潜力,可能带来变革性影响。

基于修辞关系的定制多媒体文档摘要框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-26T00:00:00Z
我国牵头家庭多媒体网关国际标准正式发布

青岛海尔主导制定的国际标准IEC 62514:2024《家庭网络多媒体网关导则》正式发布,更新了原标准以适应智能家居技术的发展,增加了多屏互动和远程交互功能,提升了家庭安全性和用户体验,获得全球专家认可,彰显了中国企业的国际领导力。

我国牵头家庭多媒体网关国际标准正式发布

实时互动网
实时互动网 · 2024-11-04T02:35:53Z
更多媒体存储:使用ChatGPT组织文件

文章探讨了如何利用ChatGPT组织媒体文件,强调开源与大科技的价值。推荐使用Gentoo系统进行高效文件压缩,以节省存储空间并提升性能。建议用户尝试压缩媒体库,并掌握视频压缩的基本知识。

更多媒体存储:使用ChatGPT组织文件

DEV Community
DEV Community · 2024-10-31T23:11:22Z
更多媒体存储:使用ChatGPT整理文件:第一部分,数据准备

随着生成性人工智能工具如ChatGPT的兴起,作者调整了文章内容,减少技术性,增加实用性。文章探讨如何通过命令行重命名文件夹和文件,最终按文件扩展名整理媒体文件存储。

更多媒体存储:使用ChatGPT整理文件:第一部分,数据准备

DEV Community
DEV Community · 2024-10-29T20:40:46Z
“AVS音视频编解码标准”被评选为“中国多媒体最具影响力科技成果”

在CCF/CSIG多媒体专委会三十年纪念活动上,AVS音视频编解码标准被评选为“中国多媒体最具影响力科技成果”。该标准推动了我国数字视频产业的发展。

“AVS音视频编解码标准”被评选为“中国多媒体最具影响力科技成果”

实时互动网
实时互动网 · 2024-07-25T02:06:08Z

提出 Guided-MELD 模型来进行传感器间的关系建模,通过学习补充过程中通过遮蔽传感器无法获取的信息,有效地提取分散的目标事件信息,从而改善事件标记和检测性能。

分布式多媒体传感器事件分析的引导式屏蔽自蒸馏建模

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-12T00:00:00Z

harness/gitness Gitness 是一个建立在 Drone 之上的新型开源开发者平台,具备代码托管和流水线功能。它提供了以下核心优势: 轻量级、超快速的代码托管和持续集成服务 支持 Docker 容器化部署 可以在本地环境中构建和运行系统,无需依赖 Docker 容器 提供完整的用户界面用于与系统交互,并支持 Swagger...

聊天、会议、多媒体一体化:多平台支持的即时通讯系统 | 开源日报 No.44

开源服务指南
开源服务指南 · 2023-11-23T06:07:49Z

以下软件,除 FFmpeg 外,均支持中文。 屏幕录像开源:OBS(直播推流软件,录屏功能也非常强大)收费:Bandicam(收费录屏软件中自认为最好用的) 屏幕录像(GIF)开源:ScreenToGif 图片处理免费:XnViewMP(图片批处理功能非常好用,商用收费) 图片编辑开源:GIMP(GNU 出品)收费:Adobe...

常用多媒体软件的开源或免费替代

iMaeGoo's Blog
iMaeGoo's Blog · 2021-09-26T05:55:00Z

emem今天上C#课时机子IP地址冲突,就百度了一下在线IP扫描一类的代码,整理了一下分享给大家。这是个非常实用的小程序,可以用于多媒体教室查询在线机子数量、公司内网在线用户管理。当然,查询机房在线IP也可以实现。

C#扫描在线IP源代码-多媒体教室、公司内网管理IP搜索

轶哥
轶哥 · 2015-11-25T15:19:26Z

本文首发www.droidsec.cn | 安卓安全中文站...

MFFA:Android多媒体文件漏洞Fuzzing框架分析与测试

Nuclear'Atk(核攻击)网络安全实验室
Nuclear'Atk(核攻击)网络安全实验室 · 2015-08-13T06:07:29Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码