小红花·文摘 - 小红花技术领袖俱乐部

Databricks如何将视频转化为可搜索的可操作智能

Databricks如何将视频转化为可搜索的可操作智能

Databricks ·

React Native需要一个新的视频播放器

React Native需要一个新的视频播放器

Mux Blog - Video technology and more ·

最简单粗暴的让 Claude Code 理解视频｜Claude Code Video Vision

最简单粗暴的让 Claude Code 理解视频｜Claude Code Video Vision

小众软件 ·

作者分享了养龟经验，利用Home Assistant和Claude Code整合监控设备，实现温度监控、视频分析和活动检测。通过对话配置系统，简化技术操作，提升养龟乐趣与效率。

Claude Code+HA 自动化实战：给宠物龟请个「电子保姆」

少数派 ·

软通动力联合华为发布全新一代国产AI服务器

软通动力联合华为发布全新一代国产AI服务器

全球TMT-美通国际 ·

在Mux上，您的视频更具价值

在Mux上，您的视频更具价值

Mux Blog - Video technology and more ·

AI应用：将自主AI引入计算机视觉应用的三种方法

AI应用：将自主AI引入计算机视觉应用的三种方法

NVIDIA Blog ·

打造更安全的空间：NVIDIA与合作伙伴将物理AI引入城市和工业基础设施

打造更安全的空间：NVIDIA与合作伙伴将物理AI引入城市和工业基础设施

NVIDIA Blog ·

Pixellot 和 TPE 携手为冰球队消除视频工作流程中的障碍

Pixellot 和 TPE 携手为冰球队消除视频工作流程中的障碍

实时互动网 ·

MCP是AI世界的HTTP：介绍Mux MCP

MCP是AI世界的HTTP：介绍Mux MCP

Mux Blog - Video technology and more ·

Naver Cloud 开发先进的 AI 视频分析工具，大幅缩短编辑时间

Naver Cloud 开发先进的 AI 视频分析工具，大幅缩短编辑时间

实时互动网 ·

视频搜索与摘要的AI蓝图现已推出，助力各行业部署视频分析AI代理

视频搜索与摘要的AI蓝图现已推出，助力各行业部署视频分析AI代理

NVIDIA Blog ·

利用GoPro视频估算国际粗糙度指数（IRI）：一种经济有效的道路检测解决方案

利用GoPro视频估算国际粗糙度指数（IRI）：一种经济有效的道路检测解决方案

DEV Community ·

本研究提出了一种新型视频分析系统AVA，基于视频语言模型（VLM），旨在提升开放性分析场景的适应性。AVA通过实时构建事件知识图谱和代理检索生成机制，显著改善复杂查询的表现，并在多个基准测试中超越现有系统，展示了处理超长视频内容的潜力。

Empowering Video Language Models for Agentic Video Analytics Systems

BriefGPT - AI 论文速递 ·

本研究评估了利用互联网视频自动检测牛跛行的可行性，提出了一种基于深度学习的3D CNN视频分析模型，达到了90%的分类准确率，简化了传统方法并提高了鲁棒性。

Assessing the Feasibility of Automatic Cattle Lameness Detection Using Internet-Sourced Video

BriefGPT - AI 论文速递 ·

本研究提出了一种描述任何内容模型（DAM），旨在解决视觉-语言模型在图像和视频特定区域生成详细描述的挑战。该模型通过聚焦提示和局部视觉骨干，结合局部细节与全局上下文，在七个基准测试中刷新了局部字幕生成的记录，显示出显著进展。

Describe Anything: Detailed Localized Image and Video Captioning

BriefGPT - AI 论文速递 ·

本研究探讨了手术室流程优化中的隐私问题，提出了一种基于数字双胞胎的隐私保护视频分析和事件检测方法。该方法在手术事件检测方面优于传统模型，有助于去标识数据共享，提升模型的通用性。

Privacy-Preserving Operating Room Workflow Analysis: Application of Digital Twins

BriefGPT - AI 论文速递 ·

商汤发布第六代大模型SenseNova V6，拥有6000亿参数的多模态能力，能够实时推理和分析视频内容。该模型在文本和视频任务上超越GPT-4.5，具备强大的推理、交互和长记忆能力，适用于数学辅导和视频剪辑等多种场景。商汤强调AI技术应服务于日常生活，解决实际问题。

刚刚，商汤发布第六代大模型：6000亿参数多模态MoE，中长视频直接可推理

量子位 ·

通过Mobile-VideoGPT的创新框架解锁实时视频分析！

通过Mobile-VideoGPT的创新框架解锁实时视频分析！

DEV Community ·

Year-End Surprise! ByteDance Research Officially Releases Video Understanding Model 'Tarsier'

Year-End Surprise! ByteDance Research Officially Releases Video Understanding Model 'Tarsier'

机器之心 ·