小红花·文摘

Kdenlive 25.04 视频编辑器推出新功能

实时互动网 ·

本研究提出了一种基于长时间点轨迹的对象分割方法，克服了传统方法对瞬时运动的依赖。通过新的损失函数，将轨迹分组为低秩矩阵，有效建模复杂运动模式，提升了运动分割任务的表现，展示了长期运动的应用潜力。

Learning Segmentation from Point Trajectories

BriefGPT - AI 论文速递 ·

本研究提出了持续SAM适应基准（CoSAM），针对动态数据流中的任意对象分割模型（SAM）适应问题。引入混合领域适配器（MoDA）算法，提升特征提取能力。实验结果表明，MoDA在持续分割任务中表现优越，具备良好的知识保留和适应性。

Continual Learning for Adaptation of Segment Anything Models

BriefGPT - AI 论文速递 ·

本文提出了一种新方法SA-GS，实现3D高斯中的对象分割，无需训练过程。通过多视角掩码生成和标签分配，SA-GS在3D分割中表现出高质量，适用于场景编辑和碰撞检测。研究还探讨了3D高斯散射的理论基础及其在视觉任务中的应用，强调高斯参数在分类和分割中的优势。

介绍 SAM 2：下一代 Meta 视频和图像分割模型 [译]

宝玉的分享 ·

介绍 SAM 2：下一代 Meta 视频和图像分割模型 [译]

宝玉的分享 ·

本文探讨了多种基于卷积神经网络（CNN）的3D视频处理方法，如4D卷积、伪3D残差网络和动态扩张卷积。这些方法在视频分类、特征学习和对象分割等任务中表现优于传统的2D和3D CNN，具有更高的准确性和计算效率。

3D 张量在视频分析中是否真的需要 5D 卷积？

BriefGPT - AI 论文速递 ·

本文提出了一种基于对象分割的帧间预测方法，显著提高了运动向量编码的准确性和效率。实验结果表明，该方法在多种配置下实现了显著的BD速率降低，并且在视频预测和压缩框架中表现优于现有技术，尤其在模型尺寸和编码效率方面。

用于帧间预测的匀加速运动模型

BriefGPT - AI 论文速递 ·

本文介绍了 PartImageNet 和 PartNet 数据集，支持对象分割和少样本学习。研究提出了基于部件的模型和弱监督部件检测网络，展示了在不同数据集上的优越性能。同时探讨了多任务学习和基于特征组的图像分类方法，强调可解释性和鲁棒性。

PartImageNet++ 数据集：为稳健识别扩展基于零件模型

BriefGPT - AI 论文速递 ·

本研究提出多种基于用户交互的对象分割方法，包括迭代训练策略、边缘引导流和文本+点击分割，旨在提高分割的准确性和用户效率。实验结果表明，这些方法在速度和准确性上优于现有技术，显著降低了用户交互成本。

Clicks2Line: 使用线条进行交互式图像分割

BriefGPT - AI 论文速递 ·

本文介绍了多种基于深度学习的交互式图像和视频对象分割方法，如AGILE3D、ClickSeg和LSeg。这些方法通过减少用户点击次数和提高分割精度，显著提升了3D点云的分割效果，并在多个数据集上表现优异。研究还探讨了用户交互模式对分割结果的影响，为进一步改进提供了重要见解。

iSeg: 基于交互式注意力的交互式 3D 分割

BriefGPT - AI 论文速递 ·

该论文综述了视频分割中使用的深度学习算法，包括对象分割和语义分割，并提供了这两种方法和数据集的详细概述，以及在几个数据集上的性能评估和未来研究机会。

视频实例分割的深度学习技术综述

BriefGPT - AI 论文速递 ·

OGC算法可在三维点云中实现多个3D物体的分割，无需人工标注，通过挖掘动态运动模式作为监督信号来实现。该算法考虑了多物体刚体性一致性和对象形状不变性，在室内和具有挑战性的室外场景中广泛评估，证明了其在对象实例分割和一般对象分割方面的杰出性能。

本文介绍了一个名为Segment Anything Model（SAM）的基础模型，用于视觉任务的开发。SAM可以根据廉价的输入提示在图像中进行对象分割。作者通过大量的视觉基准任务研究了SAM的零样本图像分割准确性，并发现SAM通常能够实现与目标任务上训练的视觉模型类似甚至超过其识别精度。他们还检查了SAM在多样化、广泛研究的基准任务集上的表现。然而，作者还研究了SAM在航空图像问题中的表现，发现由于航空图像和目标对象的独特特征，SAM在某些情况下会失败。

食品 SAM：任何食品分割

BriefGPT - AI 论文速递 ·

Kdenlive 25.04 视频编辑器推出新功能

Learning Segmentation from Point Trajectories

Continual Learning for Adaptation of Segment Anything Models

基于梯度的3D分割与高斯点云的可行性转移

介绍 SAM 2：下一代 Meta 视频和图像分割模型 [译]

介绍 SAM 2：下一代 Meta 视频和图像分割模型 [译]

3D 张量在视频分析中是否真的需要 5D 卷积？

用于帧间预测的匀加速运动模型

PartImageNet++ 数据集：为稳健识别扩展基于零件模型

Clicks2Line: 使用线条进行交互式图像分割

iSeg: 基于交互式注意力的交互式 3D 分割

视频实例分割的深度学习技术综述

一种基于点云地图的用于非结构化道路的地面分割方法

食品 SAM：任何食品分割