小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
YouTube现在允许您在搜索结果中过滤短视频

YouTube将更新搜索过滤器,允许用户单独搜索短视频或长视频。新过滤器将移除“上传日期-最后一小时”和“按评分排序”选项,增加“流行度”过滤器,以更好地满足用户需求。

YouTube现在允许您在搜索结果中过滤短视频

The Verge
The Verge · 2026-01-08T19:22:09Z
谁杀死了长视频?

姜文在中美电影论坛上被问及短剧是否会取代长视频。数据显示,短剧用户持续增长,市场规模已超电影票房,吸引了更多年轻观众。尽管短剧发展迅速,长视频仍具独特价值,政策也在支持其发展。

谁杀死了长视频?

TechWeb 全站精华
TechWeb 全站精华 · 2025-11-27T02:48:44Z
研究:YouTube上观看长视频内容的观众群体以老年为主

YouTube 是全球最大的视频平台,每月有 85% 的互联网用户使用。调查显示,35 至 64 岁的用户推动了长视频的观看,家庭观众也在增加。不同市场的观看比例差异显著,内容所有者需了解目标受众。

研究:YouTube上观看长视频内容的观众群体以老年为主

实时互动网
实时互动网 · 2025-11-11T02:32:33Z
暑期档爆款,救不了爱优腾?

暑期剧《生万物》帮助爱奇艺回暖,但长视频市场仍在萎缩。爱奇艺二季度营收下降11%,净亏损1.34亿元。短剧崛起导致用户注意力分散,长剧面临更大压力,行业信心不足。政策松绑虽有利,但难以根本改变现状。

暑期档爆款,救不了爱优腾?

TechWeb 全站精华
TechWeb 全站精华 · 2025-09-08T03:33:56Z
长视频平台,天生命不好

长视频平台面临高成本、用户流失和付费意愿低等挑战,盈利模式不稳定。爱奇艺和腾讯视频的财报显示收入下降,短视频的崛起进一步分流用户。长视频需创新商业模式,探索新内容和IP业务以应对竞争。

长视频平台,天生命不好

TechWeb 全站精华
TechWeb 全站精华 · 2025-08-26T03:17:21Z
SlowFast-LLaVA-1.5:一种高效的长视频理解视频大语言模型家族

本文介绍了SlowFast-LLaVA-1.5(SF-LLaVA-1.5),一种高效的视频大语言模型,专注于长视频理解。该模型结合了SlowFast机制和联合视频-图像训练,在1B和3B规模下表现出色,满足移动友好模型的需求。实验结果显示,SF-LLaVA-1.5在多个视频任务上表现优异,尤其在长视频理解方面达到了最先进水平。

SlowFast-LLaVA-1.5:一种高效的长视频理解视频大语言模型家族

Apple Machine Learning Research
Apple Machine Learning Research · 2025-08-22T00:00:00Z

智源研究院与上海交通大学联合推出开源视频理解模型Video-XL-2,该模型支持单卡处理万帧视频,编码2048帧仅需12秒。在长视频理解任务中表现优异,超越现有轻量级模型,具有广泛应用潜力,如影视分析和异常行为监测。

单卡搞定万帧视频理解!智源研究院开源轻量级超长视频理解模型Video-XL-2

量子位
量子位 · 2025-06-04T06:11:00Z

本研究提出了帧选择增强生成(FRAG)方法,旨在提高长视频和长文档的理解能力。FRAG通过独立评估每帧的相关性,能够在无需处理长上下文的情况下生成输出,从而显著提升现有多模态模型的表现。

FRAG: Frame Selection Augmented Generation for Long Video and Long Document Understanding

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-24T00:00:00Z
长视频不“拼好饭”

短剧的兴起冲击了长视频行业,但观众对内容的需求依然存在。尽管短剧数量众多,制作成本和收益问题突出,优质长剧仍具市场价值。观众更倾向于精炼、紧凑的剧情,长视频平台需提升内容质量以满足用户需求。

长视频不“拼好饭”

TechWeb 全站精华
TechWeb 全站精华 · 2025-04-22T01:56:36Z
介绍FramePack AI:以最小硬件生成高质量视频

FramePack AI是一款创新的AI视频生成平台,用户可通过文本或图像轻松制作高质量视频。它可在仅6GB GPU内存的笔记本上运行,适合内容创作者、营销人员和数字艺术家。该平台使长视频生成变得简单高效,用户可自定义视频参数,轻松制作专业级视频。

介绍FramePack AI:以最小硬件生成高质量视频

DEV Community
DEV Community · 2025-04-19T04:31:18Z

本研究提出了一种时间动态上下文(TDC)编码方法,旨在解决长视频处理中的信息损失问题。通过语义一致性场景分割和基于查询的Transformer,有效整合视频、音频和文本信息,实验结果表明其在视频理解方面表现优异。

Multimodal Long Video Modeling Based on Temporal Dynamic Context

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-14T00:00:00Z

本研究提出了“时间搜索”框架,以解决长视频处理中的视觉幻觉问题。该框架结合聚光灯机制和反思机制,显著提高了长视频理解的准确性,LVBench准确率从41.8%提升至51.5%。

TimeSearch: Hierarchical Video Search with Spotlight and Reflection for Human-like Long Video Understanding

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-02T00:00:00Z

本研究提出了一种新方法,通过视觉上下文样本扩展和自我奖励对齐,解决多模态大型语言模型在理解长视频时的挑战。该方法结合不同关键帧组合,显著提高了模型在七个数据集上的表现和回答正确率。

From Trial to Triumph: Advancing Long Video Understanding through Visual Context Sample Scaling and Self-reward Alignment

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-26T00:00:00Z

该研究提出了一种名为LanDiff的混合框架,旨在克服文本到视频生成中语言模型和扩散模型的局限性。LanDiff通过粗到细的生成方法有效整合两者优势,在多个基准测试中表现优异,尤其在长视频生成方面超越了现有模型。

两者的最佳结合:整合语言模型与扩散模型以生成视频

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-06T00:00:00Z

VideoRoPE是一种新的视频位置嵌入策略,扩展了RoPE在视频领域的应用,提升了长视频的理解和检索能力。它通过三维结构保留时空关系,采用低频时间分配、对角线布局和可调时间间隔,表现出更强的鲁棒性和适应性。

Llama都在用的RoPE有了视频版,长视频理解/检索绝佳拍档

量子位
量子位 · 2025-02-19T04:06:07Z

本研究提出了MomentSeeker基准,旨在评估长视频时刻检索模型的表现。该基准涵盖超过500秒的视频,展示了现有方法的局限性,并通过微调的多模态大语言模型取得显著成果,推动了该领域的研究进展。

MomentSeeker: A Comprehensive Benchmark and Strong Baseline for Moment Retrieval in Long Videos

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-18T00:00:00Z

本研究提出了StreamChat框架,旨在解决现有视频理解模型在长视频、多轮对话和动态场景中的不足。通过分层记忆系统,StreamChat实现了高效的视频特征处理,实验结果表明其在准确性和响应时间上优于现有模型。

Stream Media Video Understanding and Enhanced Memory Knowledge for Multi-turn Interaction

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-23T00:00:00Z
VideoChat-Flash:针对长文本视频建模的分层压缩技术,可在计算量减少 100 倍的情况下处理长文本视频

本文介绍了一种新型的分层视频标记压缩方法HiCo及其在VideoChat-Flash中的应用,旨在提高长上下文视频的处理效率。该方法通过压缩视频信息,减少计算量,同时保留关键数据,显著提升了模型在短视频和长视频理解上的表现,超越了现有的SOTA模型。

VideoChat-Flash:针对长文本视频建模的分层压缩技术,可在计算量减少 100 倍的情况下处理长文本视频

实时互动网
实时互动网 · 2025-01-20T03:42:47Z

本研究提出AdaCM$^2$方法,旨在提高视频理解模型在处理长视频时的效率。通过自适应跨模态记忆压缩,AdaCM$^2$增强了视频与文本的对齐能力,并显著降低了内存使用。实验结果表明,该方法在多个数据集上表现优异,特别是在LVU数据集中,任务表现提高4.5%,GPU内存消耗减少65%。

AdaCM$^2$: Adaptive Cross-Modality Memory Compression for Understanding Extremely Long Videos

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-19T00:00:00Z

本研究提出了一种动态协作网络DynFocus,旨在解决大型语言模型在视频理解中的信息保持问题,特别是在长视频中。该方法通过动态选择重要帧和分离编码详细视觉信息,有效减少记忆消耗并提升性能。实验结果表明其在多个基准上表现优异。

Dynamic Cooperative Network Empowers Video Understanding for Large Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-19T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码