小红花·文摘

保罗·拉姆齐：PostGIS性能：通过分解和细分提升边界框性能

Planet PostgreSQL ·

Qt -- 通过 Qt xml 读取 VOC2012 数据集xml标注文件中的目标名称和包含框

DEV Community ·

如何使用Tesseract.js在识别的文本周围绘制边界框

DEV Community ·

Adirik在Replicate上发布的Grounding-Dino模型初学者指南

DEV Community ·

该方案为百度网盘AI大赛表格检测的第二名方案，采用ppyoloe-plus-x进行边界框检测，使用DBNet进行语义分割，并通过PP-LCNet预测表格方向，实现高效的表格检测与识别。

C# OpenCvSharp DNN 实现百度网盘AI大赛-表格检测第2名方案第三部分-表格方向识别...

dotNET跨平台 ·

该算法为百度网盘AI大赛表格检测的第二名方案，包含表格边界框检测、分割和方向识别。使用ppyoloe-plus-x进行边界框预测，DBNet进行语义分割，PP-LCNet预测表格方向，代码采用C#和OpenCvSharp实现。

C# OnnxRuntime 实现百度网盘AI大赛-表格检测第2名方案第二部分-表格分割

dotNET跨平台 ·

C# OpenCvSharp DNN 实现百度网盘AI大赛-表格检测第2名方案第一部分-表格边界框检测...

dotNET跨平台 ·

在直播流上构建实时对象检测

DEV Community ·

本研究提出了一种新颖的白盒攻击方法，针对视觉物体跟踪器的局限性，通过边界框攻击变换器骨干网络。实验证明该方法在多个变换器跟踪器上表现优越，验证了其有效性。

Adversarial Boundary Box Generation Attack for Visual Object Trackers (ABBG)

BriefGPT - AI 论文速递 ·

本研究提出VLM-Grounder框架，旨在解决传统3D视觉定位在数据稀缺时的局限性。通过动态拼接图像序列和定向反馈，能够精确估计3D边界框。实验结果表明，该方法在ScanRefer和Nr3D数据集上优于以往的零-shot方法，展现出强大的应用潜力。

VLM-Grounder: A VLM Agent for Zero-Shot 3D Visual Grounding

BriefGPT - AI 论文速递 ·

C# OnnxRuntime yolov11 detection

dotNET跨平台 ·

本文介绍了一种新型目标检测方法，通过点击物体中心标注边界框，结合弱监督技术，显著减少标注时间。研究提出了多种基于中心点和自监督学习的算法，提升了目标计数和检测的精度与效率，尤其在多个数据集上表现优异。

基于点监督的物体计数与定位的密集中心方向回归

BriefGPT - AI 论文速递 ·

掌握计算机视觉基础：Python实战指南

The New Stack ·

本文提出了一种半监督三维物体检测框架，通过三维边界框参数化、不确定性估计和伪标签选择等设计，显著提高了检测准确性。在不同数据集上的实验证明，该方法优于基准模型，尤其在激光雷达目标检测中，平均精度提高了3.6%。

利用不确定性感知的有界框解决无监督 3D 物体检测

BriefGPT - AI 论文速递 ·

本文介绍了一种基于变压器的场景文本检测模型，能够有效检测文本并获取边界框。该模型在多个数据集上取得了先进成果，提出了隐式特征对齐方法，提升了多行文本识别能力，并展示了新的多模态架构和文本引导的域泛化框架，增强了文本检测的准确性和效率。

文本分组适配器：为布局分析适配预训练的文本检测器

BriefGPT - AI 论文速递 ·

本文介绍了多种基于边界框注释的弱监督学习方法，如WeakPolyp、IBoxCLA和BoxSnake等。这些方法通过不同技术提高了分割精度，尤其在前列腺和脑病变应用中表现出色，实验结果显示其性能与完全监督模型相当，无需密集注释。

MonoBox: 使用单调性约束进行无限度的基于框的多波束 001 001 息肉分割

BriefGPT - AI 论文速递 ·

本文评估了GPT-4V在医学图像任务中的能力，发现其在为胸部X射线图像生成描述性报告方面有潜力，但在某些评估指标上仍需改进。在医学问答方面，GPT-4V在问题类型方面表现出熟练度，但准确性不及现有基准。在视觉基础领域，GPT-4V在识别边界框方面显示了初步的潜力，但精度不够。评估强调了GPT-4V在医学图像领域的重要潜力，但需要针对性的改进来充分发挥其能力。

探索面向 VQA 的 GPT-4V 在零样本异常检测中的接地潜力

BriefGPT - AI 论文速递 ·

本文评估了GPT-4V在医学图像任务中的表现，发现其在为胸部X射线图像生成描述性报告方面有潜力，但在某些评估指标上需要改进。在医学问答方面，GPT-4V在问题类型方面表现熟练，但准确性不及现有基准。在视觉基础领域，GPT-4V在识别边界框方面显示了初步的潜力，但精度不够。评估强调了GPT-4V在医学图像领域的潜力，但需要针对性的改进。

GPT-Vision 在科学图像中的根本直觉

BriefGPT - AI 论文速递 ·

本文评估了GPT-4V在医学图像任务中的能力，发现其在为胸部X射线图像生成描述性报告方面有潜力，但在某些评估指标上需要改进。在医学问答方面，GPT-4V在问题类型方面表现熟练，但准确性不及现有基准。在视觉基础领域，GPT-4V在识别边界框方面显示了初步潜力，但精度不够。评估强调了GPT-4V在医学图像领域的潜力，但需要针对性的改进来充分发挥其能力。

GPT-4V 作为视觉语言任务的通用评估器

BriefGPT - AI 论文速递 ·

本文评估了GPT-4V在医学图像任务中的能力，发现其在为胸部X射线图像生成描述性报告方面有潜力，但在某些评估指标上仍需改进。在医学问答方面，GPT-4V在问题类型方面表现出熟练度，但准确性还不及现有基准。在视觉基础领域，GPT-4V在识别边界框方面显示了初步的潜力，但精度不够。评估强调了GPT-4V在医学图像领域的重要潜力，但需要针对性的改进来充分发挥其能力。

GPT-4V 在医学影像中的多模态能力综合研究

BriefGPT - AI 论文速递 ·