小红花·文摘

本文讨论了自监督视觉模型DINO及其在目标检测中的应用，重点介绍了Grounding DINO和DINO-X。Grounding DINO通过语言信息将闭集检测器扩展到开放集场景，采用双编码器-单解码器架构，结合图像和文本特征进行对象检测，创新设计了特征提取、增强和查询选择等方面，以提升检测性能。

IDEA-Research推出的一系列检测、分割模型：从DINO(改进版DETR)、Grounding Dino、DINO-X到Grounded SAM2

结构之法算法之道 ·

本研究分析了乒乓球广播视频中的球旋转和轨迹。通过2D轨迹推断3D轨迹和初始转动，提出了一种基于合成数据训练神经网络的方法，达到了92.0%的旋转分类准确率和0.19%的2D重投影误差。

Research on Ball Spin and Trajectory Analysis in Table Tennis Broadcast Videos: Physically Grounded Synthetic-to-Real Transfer

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的语义方向概念，解决了视觉语言模型在物体方向理解上的不足。通过构建OrienText300K数据集，提升了机器人操作的精度，具有广泛应用潜力。

SoFar: Language-Grounded Orientation Bridges Spatial Reasoning and Object Manipulation

BriefGPT - AI 论文速递 ·

本研究提出了一种名为微理论的方法，旨在提升语言模型的理解能力。通过系统提炼主题核心知识，微理论显著增强了模型的答案验证能力和准确性，并有效补充了现有数据集，提升了对特定主题的理解。

From Models to Microtheories: Distilling a Model's Thematic Knowledge for Grounded Question Answering

BriefGPT - AI 论文速递 ·

本研究提出了一种轻量级模型RAGulator，用于实时检测大语言模型生成的上下文外文本，支持企业安全采用RAG应用。研究发现DeBERTa模型在性能和速度上表现最佳，且无需额外文本预处理，为企业本地部署提供了重要的速度和资源考量。

RAGulator: A Lightweight Out-of-Context Detector for Grounded Text Generation

BriefGPT - AI 论文速递 ·

《Grounded》和《Pentiment》是微软首批登陆Nintendo Switch的Xbox独占游戏

The Verge ·

本文主要介绍了在电商广告行业下，通过 Amazon SageMaker 使用 Grounded-SAM 进行营销素材生成。我们详细介绍了，1/ 通过 ControlNet 中的 Canny 模型进行无代码图像编辑，以及2/ 通过 Grounded-SAM（Grounding DINO 和 Segment Anything）利用代码进行图像编辑。此外，针对上一版本方案，新增支持了...

生花妙笔信手来 – 基于 Amazon SageMaker 使用 Grounded-SAM 加速电商广告素材生成 [1]

任霏博客 ·

生花妙笔信手来 – 基于 Amazon SageMaker 使用 Grounded-SAM 加速电商广告素材生成 [1]

任霏博客 ·