小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate
ICLR 2026 | 火山引擎多媒体实验室提出GenDR, 探索扩散模型超分落地难题

扩散模型在图像生成方面取得了重要进展,但由于推理步骤多和分辨率限制,实际应用受到制约。为提高效率和图像保真度,提出了GenDR和GenDR-Pix模型,优化了VAE和UNet,支持高分辨率图像处理,增强了细节恢复效果,推动生成技术与实际业务的结合。

ICLR 2026 | 火山引擎多媒体实验室提出GenDR, 探索扩散模型超分落地难题

实时互动网
实时互动网 · 2026-03-04T06:39:12Z
网龙与字节跳动旗下火山引擎达成AI生态与联合创新合作

网龙与字节跳动的火山引擎签署合作协议,共同开发AIGC教育资源,构建创新教育生态,重点在技术创新、资源共创和商业应用,推动智能教育内容的开放生态,应用于智慧校园和师资培训等场景。

网龙与字节跳动旗下火山引擎达成AI生态与联合创新合作

全球TMT-美通国际
全球TMT-美通国际 · 2026-01-27T08:41:03Z
火山引擎正式发布豆包语音识别模型 2.0

火山引擎发布的豆包语音识别模型2.0提升了上下文理解和多模态视觉识别能力,支持13种语言,优化了专有名词和多音字的识别,增强了语音识别的准确性和适应性。

火山引擎正式发布豆包语音识别模型 2.0

实时互动网
实时互动网 · 2025-12-05T07:30:25Z
火山引擎多媒体实验室 AIGC 视频画质理解大模型 VQ-Insight 入选 AAAI 2025 Oral

AAAI 2026会议共录用4167篇论文,录取率为17.6%。火山引擎与北大合作的VQ-Insight论文获口头报告,提出了一种基于强化学习的视频质量理解方法,显著提升了AIGC视频生成质量,具备良好的泛化能力和解释性。

火山引擎多媒体实验室 AIGC 视频画质理解大模型 VQ-Insight 入选 AAAI 2025 Oral

实时互动网
实时互动网 · 2025-11-26T09:58:25Z

AAAI 2025 Oral | 火山引擎多媒体实验室提出VQ-Insight,AIGC视频画质理解大模型

机器之心
机器之心 · 2025-11-20T15:51:18Z

Gartner发布的2025全球AI应用开发平台魔力象限中,火山引擎凭借豆包大模型在中国排名第一、全球第五,显示出其优异的落地能力,市场逐渐成熟。

Gartner首次发布大模型报告:火山引擎排名中国厂商第一

量子位
量子位 · 2025-11-20T03:13:02Z
虎牙直播×火山引擎:S15全球总决赛落幕,超高画质引爆观赛体验

11月9日,英雄联盟S15全球总决赛圆满落幕,T1战队夺冠。虎牙直播作为官方平台,热度超过4000万,火山引擎提供技术支持,确保直播质量与低延迟。双方合作应对流量峰值,推动AI与直播技术创新,提升电竞直播体验。

虎牙直播×火山引擎:S15全球总决赛落幕,超高画质引爆观赛体验

实时互动网
实时互动网 · 2025-11-10T03:00:03Z
火山引擎多媒体实验室画质理解大模型 Q-Insight 入选 NeurIPS 2025 Spotlight

NeurIPS 2025公布了5290篇论文录用结果,其中火山引擎与北大合作的Q-Insight被评为亮点文章。Q-Insight通过强化学习优化图像质量,超越传统方法,展现出卓越的准确性和泛化能力,推动音视频技术发展。

火山引擎多媒体实验室画质理解大模型 Q-Insight 入选 NeurIPS 2025 Spotlight

实时互动网
实时互动网 · 2025-10-22T09:23:03Z
火山引擎多媒体实验室联合南开大学推出TempSamp-R1强化学习新框架,视频时序理解大模型SOTA!

视频时序定位是视频理解的关键任务,旨在根据自然语言查询精确定位视频片段。火山引擎与南开大学联合研发的TempSamp-R1框架,通过创新的混合策略采样、非线性优势塑造和混合CoT训练,显著提升了视频时序定位的效率和精度,已在多个数据集上刷新记录,推动智能剪辑技术的发展。

火山引擎多媒体实验室联合南开大学推出TempSamp-R1强化学习新框架,视频时序理解大模型SOTA!

实时互动网
实时互动网 · 2025-10-21T09:48:06Z
火山引擎全新发布和升级了四款豆包大模型

火山引擎在武汉发布了四款豆包大模型,升级至1.6版本,支持多种思考长度,并推出新语音合成和复刻模型。智能模型路由功能帮助企业优化模型选择,提升效率和降低成本。预计到2025年,豆包大模型日均调用量将突破30万亿,火山引擎在公有云市场占有率达49.2%。

火山引擎全新发布和升级了四款豆包大模型

实时互动网
实时互动网 · 2025-10-16T03:47:08Z

根据IDC报告,预计到2025年上半年,中国公有云大模型调用量将达到536.7万亿Tokens,其中火山引擎市场份额为49.2%居首,阿里云和百度智能云分别占27%和17%。到2028年,市场规模预计将达到482.4亿元人民币。

IDC:2025年上半年大模型公有云市场,火山引擎占比49.2%排名第一

量子位
量子位 · 2025-09-19T08:46:55Z

火山引擎发布PromptPilot,推动大模型应用高效落地

机器之心
机器之心 · 2025-09-16T08:52:00Z

参加火山引擎的PromptPilot发布会,深入了解产品功能,尤其是提示词优化的批量评测与智能优化,显著提升效率。现场实操体验顺利,SDK展现出强大潜力,期待未来更多惊喜。

PromptPilot 产品发布:火山引擎助力AI提示词优化的新利器 - 努力的小雨

努力的小雨
努力的小雨 · 2025-09-15T14:24:00Z
火山引擎多媒体实验室重要突破!LiveGS 技术登榜 SIGGRAPH,重新定义移动端自由视角视频直播

火山引擎多媒体实验室的LiveGS技术成功实现移动端实时自由视角视频直播,解决了高计算负载和带宽需求问题。该技术将在2025年SIGGRAPH展出,应用于体育直播和虚拟演出等场景,提升用户体验。

火山引擎多媒体实验室重要突破!LiveGS 技术登榜 SIGGRAPH,重新定义移动端自由视角视频直播

实时互动网
实时互动网 · 2025-09-11T09:31:01Z

即梦、火山引擎联合上海电影发起AI影像作品征集,优秀作品将直通釜山电影节

机器之心
机器之心 · 2025-08-15T14:07:00Z

本文介绍了Claude Code Proxy代理服务的部署步骤,包括下载、安装、启动服务、登录管理界面、配置火山引擎API账户及创建API Key。用户可以灵活切换AI模型,统一管理账号,简化集成流程。

Claude Pro太贵?教你用火山引擎API免费玩转Claude Code

dotNET跨平台
dotNET跨平台 · 2025-08-04T00:03:13Z

火山引擎发布豆包系列新模型,包括图像编辑模型3.0和同声传译模型2.0,提升了指令遵循和语音延迟,支持多模态检索,并推出开源开发工具和模型托管方案,助力企业AI应用落地。

火山引擎发布豆包最新图像编辑、同传模型,加速Agent开发落地

量子位
量子位 · 2025-07-30T05:32:20Z
ICME 2025 | 火山引擎在国际音频编码能力挑战赛中夺得冠军

音频编码器在多模态大模型中至关重要。ICME 2025音频编码器挑战赛吸引了多家知名企业参与,火山引擎凭借其技术团队在多个任务中获胜,展示了强大的音频特征提取能力,推动了音频表征的进步。

ICME 2025 | 火山引擎在国际音频编码能力挑战赛中夺得冠军

实时互动网
实时互动网 · 2025-07-07T06:11:14Z
移远通信Wi-Fi版本AI玩具整体解决方案亮相火山引擎原力大会

2025年6月11-12日,火山引擎原力大会在北京举行。移远通信展示了升级版Wi-Fi AI玩具解决方案,集成硬件、音频算法和物联网平台,支持高速连接和低功耗,具备多种唤醒方式,便于用户远程控制和管理。

移远通信Wi-Fi版本AI玩具整体解决方案亮相火山引擎原力大会

全球TMT-美通国际
全球TMT-美通国际 · 2025-06-12T02:31:21Z

元戎启行与火山引擎合作,计划于2025年推出具备空间语义理解、障碍物识别、文字引导牌理解和语音控车等功能的VLA模型,以提升AI汽车的安全性和智能化水平。

元戎启行周光:携手火山引擎,基于豆包大模型打造物理世界Agent

量子位
量子位 · 2025-06-11T10:27:29Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码