BriefGPT - AI 论文速递 ·

重新思考开放词汇分割的评估指标

💡 原文中文，约500字，阅读约需1分钟。

📝

内容提要

该文提出了针对开放词汇分割任务的三个新型评估指标，即 Open mIoU、Open AP 和 Open PQ，并在 12 种开放词汇方法上进行了基准测试，旨在为社区带来关于如何评估模型的开放能力的新思考。

🎯

关键要点

提出了三个新型评估指标：Open mIoU、Open AP 和 Open PQ。
评估指标旨在解决开放词汇分割任务中的评估问题。
现有评估方法依赖于闭集指标，未考虑预测与实际类别的相似性。
通过综合定量分析和用户研究，调查了11种相似性测量方法。
在12种开放词汇方法上对新评估指标进行了基准测试。
尽管相似性距离具有主观性，指标仍能有效评估开放词汇分割方法的能力。
希望为社区提供关于评估模型开放能力的新思考。
评估代码已在GitHub上发布。

🏷️

标签

Open AP Open PQ Open mIoU 开放词汇分割评估指标

➡️

继续阅读

Issue #744: CPython ABI, CLAUDE.md, Itertools Cheatsheet, and More (2026-07-21)
#744 – JULY 21, 2026 View in Browser » What Every Dev Should Know About t...
Announcing the Public Preview of Discover and Domains, powered by Unity Catalog
Today, we're announcing the Public Preview of Domains and the Discover pa...
Android Studio Quail 2 Redesigns Agent Mode, Streamlines AI-Assisted Coding
The latest release of Android Studio, Quail 2, now stable, expands Gemini/AI ...
Peak Design’s modular Field Bracket has a finder tag built-in
I am a very clumsy man. So clumsy, that I have AirTags hanging off practicall...
Nearly every Kindle is steeply discounted at Best Buy
If you’ve been thinking about picking up a Kindle before school starts, or fo...
Single-pass AI code isn’t dead, but “high-reasoning” is the next frontier
Ask an AI model what comes next after “bacon-double”, and the return is fairl...