小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

作者分享了养龟经验,利用Home Assistant和Claude Code整合监控设备,实现温度监控、视频分析和活动检测。通过对话配置系统,简化技术操作,提升养龟乐趣与效率。

Claude Code+HA 自动化实战:给宠物龟请个「电子保姆」

少数派
少数派 · 2026-04-10T03:35:33Z
软通动力联合华为发布全新一代国产AI服务器

华为在深圳的合作伙伴大会上发布了搭载Atlas 350的AI服务器A860 A5,具备强大算力和灵活扩展性,适用于AI训练、推理和视频分析等场景。

软通动力联合华为发布全新一代国产AI服务器

全球TMT-美通国际
全球TMT-美通国际 · 2026-03-23T02:49:00Z
在Mux上,您的视频更具价值

视频存储位置的重要性日益增加,视频不仅是观看内容,更是数据和功能的结合。许多初创公司错误地将视频视为简单的交付工具,忽视了其潜在价值。Mux致力于提供可编程的视频基础设施,支持视频的智能处理和分析,帮助开发者创造更具创意的产品。未来的视频在于理解和利用其内容,而不仅仅是传输。

在Mux上,您的视频更具价值

Mux Blog - Video technology and more
Mux Blog - Video technology and more · 2026-03-19T16:51:06Z
AI应用:将自主AI引入计算机视觉应用的三种方法

本文探讨了将视觉语言模型(VLM)应用于视频分析,以提升计算机视觉系统的智能化。VLM通过密集标注、增强警报和AI推理,提供丰富的上下文信息,提升视频搜索和分析效率,帮助企业做出更准确的决策和控制成本。

AI应用:将自主AI引入计算机视觉应用的三种方法

NVIDIA Blog
NVIDIA Blog · 2025-11-13T18:50:06Z
打造更安全的空间:NVIDIA与合作伙伴将物理AI引入城市和工业基础设施

NVIDIA通过RTX PRO 6000 GPU推动物理AI在智能城市和工业中的应用,提升安全性和生产力。与多家公司合作,利用视频传感器和AI技术,自动化危险任务,改善交通和公共安全。NVIDIA Metropolis平台简化了视频分析AI的开发与部署,帮助企业提高效率和安全。

打造更安全的空间:NVIDIA与合作伙伴将物理AI引入城市和工业基础设施

NVIDIA Blog
NVIDIA Blog · 2025-08-11T15:00:44Z
Pixellot 和 TPE 携手为冰球队消除视频工作流程中的障碍

Pixellot与TPE合作,利用AI摄像头将冰球比赛视频直接传输至TPE平台,简化视频分析流程,提高决策效率。这一合作增强了Pixellot在冰球领域的影响力,支持青少年运动员的发展。

Pixellot 和 TPE 携手为冰球队消除视频工作流程中的障碍

实时互动网
实时互动网 · 2025-07-29T02:33:40Z
MCP是AI世界的HTTP:介绍Mux MCP

Mux推出了多功能通信协议(MCP),旨在简化AI与服务之间的通信。MCP通过JSON架构标准化工具和数据源的描述,使AI能够更便捷地调用Mux的API,从而提升视频分析和监控能力。

MCP是AI世界的HTTP:介绍Mux MCP

Mux Blog - Video technology and more
Mux Blog - Video technology and more · 2025-07-03T18:24:05Z
Naver Cloud 开发先进的 AI 视频分析工具,大幅缩短编辑时间

韩国Naver Cloud推出的AI视频助手MAIU能够自动分析视频信息并生成元数据,帮助用户快速定位所需场景,将编辑时间从32小时缩短至2小时,显著提升视频制作效率。

Naver Cloud 开发先进的 AI 视频分析工具,大幅缩短编辑时间

实时互动网
实时互动网 · 2025-05-23T02:22:35Z
视频搜索与摘要的AI蓝图现已推出,助力各行业部署视频分析AI代理

视频分析AI代理时代已来临,NVIDIA推出结合计算机视觉和大型语言模型的视频搜索与摘要蓝图,帮助各行业高效分析海量视频,提升工作效率。制造业和智慧城市等领域正在利用这些AI代理优化操作、降低成本、提高安全性和生产力。

视频搜索与摘要的AI蓝图现已推出,助力各行业部署视频分析AI代理

NVIDIA Blog
NVIDIA Blog · 2025-05-19T04:43:51Z
利用GoPro视频估算国际粗糙度指数(IRI):一种经济有效的道路检测解决方案

评估道路质量的重要指标是国际粗糙度指数(IRI)。传统测量工具成本高,而结合GoPro相机和算法可低成本估算IRI。通过录制视频并进行分析,可以快速获取道路状况。我们推出了DPS-IRI平台,用户可上传视频以获得IRI估算。

利用GoPro视频估算国际粗糙度指数(IRI):一种经济有效的道路检测解决方案

DEV Community
DEV Community · 2025-05-02T07:12:02Z

本研究提出了一种新型视频分析系统AVA,基于视频语言模型(VLM),旨在提升开放性分析场景的适应性。AVA通过实时构建事件知识图谱和代理检索生成机制,显著改善复杂查询的表现,并在多个基准测试中超越现有系统,展示了处理超长视频内容的潜力。

Empowering Video Language Models for Agentic Video Analytics Systems

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-01T00:00:00Z

本研究评估了利用互联网视频自动检测牛跛行的可行性,提出了一种基于深度学习的3D CNN视频分析模型,达到了90%的分类准确率,简化了传统方法并提高了鲁棒性。

Assessing the Feasibility of Automatic Cattle Lameness Detection Using Internet-Sourced Video

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-23T00:00:00Z

本研究提出了一种描述任何内容模型(DAM),旨在解决视觉-语言模型在图像和视频特定区域生成详细描述的挑战。该模型通过聚焦提示和局部视觉骨干,结合局部细节与全局上下文,在七个基准测试中刷新了局部字幕生成的记录,显示出显著进展。

Describe Anything: Detailed Localized Image and Video Captioning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-22T00:00:00Z

本研究探讨了手术室流程优化中的隐私问题,提出了一种基于数字双胞胎的隐私保护视频分析和事件检测方法。该方法在手术事件检测方面优于传统模型,有助于去标识数据共享,提升模型的通用性。

Privacy-Preserving Operating Room Workflow Analysis: Application of Digital Twins

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-17T00:00:00Z

商汤发布第六代大模型SenseNova V6,拥有6000亿参数的多模态能力,能够实时推理和分析视频内容。该模型在文本和视频任务上超越GPT-4.5,具备强大的推理、交互和长记忆能力,适用于数学辅导和视频剪辑等多种场景。商汤强调AI技术应服务于日常生活,解决实际问题。

刚刚,商汤发布第六代大模型:6000亿参数多模态MoE,中长视频直接可推理

量子位
量子位 · 2025-04-10T14:02:59Z
通过Mobile-VideoGPT的创新框架解锁实时视频分析!

Mobile-VideoGPT是一种创新的实时视频分析框架,采用双编码器架构,能够高效处理视频数据,广泛应用于安全监控、医疗和娱乐等领域,提供即时洞察和决策支持。

通过Mobile-VideoGPT的创新框架解锁实时视频分析!

DEV Community
DEV Community · 2025-03-29T08:06:08Z
Year-End Surprise! ByteDance Research Officially Releases Video Understanding Model 'Tarsier'

ByteDance Research 发布了视频理解大模型 Tarsier2,具备强大的视频分析能力,能够细致捕捉人物动作和情节发展。经过大规模预训练和后训练,Tarsier2 在视频描述任务上超越了多款模型,展现出广泛的应用潜力,尤其在机器人和智能驾驶领域。

Year-End Surprise! ByteDance Research Officially Releases Video Understanding Model 'Tarsier'

机器之心
机器之心 · 2025-01-25T12:20:12Z
亚马逊Rekognition

亚马逊Rekognition是一项基于云的图像和视频分析服务,提供文本识别、内容过滤和面部分析等功能,支持多种语言。其按需计费,适用于电商的产品分类、视觉搜索和内容审核等场景。在物体检测和面部分析方面,Rekognition优于谷歌云视觉。

亚马逊Rekognition

DEV Community
DEV Community · 2025-01-23T03:35:15Z
Notate - 开源 🚀 多模型RAG桌面应用:从本地到云端,支持Transformers、Llama等

这是一款支持AI研究的桌面应用,具备隐私保护功能,用户可通过简单的点击和上传进行文档和视频分析,支持本地和云端AI,无需编码。

Notate - 开源 🚀 多模型RAG桌面应用:从本地到云端,支持Transformers、Llama等

DEV Community
DEV Community · 2025-01-22T04:14:44Z
训练多模态人工智能模型的5个有用数据集

多模态人工智能系统通过结合文本、图像、音频和视频等形式,变得愈发强大。构建有效的多模态AI模型需要高质量的数据集,以帮助模型理解复杂的语义关系。文章介绍了Flickr30K Entities、InternVid、MuSe-CaR、MovieQA和MINT-1T等重要数据集,涵盖图像标注、视频分析和情感分析等应用,为AI模型提供了丰富的训练材料,推动了多模态AI的发展。

训练多模态人工智能模型的5个有用数据集

The New Stack
The New Stack · 2025-01-15T17:30:10Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码