标签

 数据集 

相关的文章:

本列表汇集了各类数据集及其应用,包括深度学习、计算机视觉和自然语言处理等领域,助力研究与开发。

人工智能仍然无法计数。我创建了一个数据集来证明这一点:VisQuant

I’ve been experimenting with GPT-4V, Claude, and Gemini and realized something strange: They can describe art. Solve riddles. Explain GPTs. But ask: “How many pencils are on the table?” Or “Which...

作者测试了GPT-4V、Claude和Gemini,发现它们在艺术描述和解谜方面表现良好,但在简单视觉问题上表现不佳。为此,他创建了VisQuant基准,专注于评估模型的视觉智能,包括计数和空间关系。VisQuant使用100张合成图像,旨在揭示模型推理中的缺陷。

人工智能仍然无法计数。我创建了一个数据集来证明这一点:VisQuant
原文英文,约200词,阅读约需1分钟。发表于:
阅读原文
原文中文,约1400字,阅读约需4分钟。发表于:
阅读原文
原文中文,约7800字,阅读约需19分钟。发表于:
阅读原文

RECALL-MM:用于风险分析的消费者产品召回多模态数据集,利用计算方法和大型语言模型

本研究针对产品召回信息在工程设计过程中的潜在风险和隐患未被充分利用的问题,提出了一种名为RECALL-MM的多模态数据集,通过历史信息和生成方法进行数据驱动的风险评估。研究的关键发现是在数据集中识别的模式可以显著提高安全措施,并展示了如何利用数据驱动工具指导设计中的安全决策。

发表于:
阅读原文

合成艺术生成与深度伪造检测: 关于贾米尼·罗伊启发数据集的研究

本研究聚焦于合成艺术作品的检测难题,特别是在高质量和特定文化背景下的深度伪造艺术品。通过微调Stable Diffusion 3,并运用ControlNet和IPAdapter技术生成真实的图像,从而创建了一个包含真实和AI生成艺术作品的新数据集。研究成果表明,当前深度伪造检测方法在应对这些高质量合成作品时面临重大挑战,这为未来有效检测合成艺术奠定了基础。

发表于:
阅读原文

航拍数据集汇总,覆盖车辆/船舶检测/物体评估/城市景观……

与传统的数据采集方式相比,航拍可以在短时间内获取大规模的信息数据,大大提高了数据采集的效率。该数据集用于空中景观分类,图像共 12k 张,包含 15 个不同类别(农业、飞机场、海滩、城市、沙漠、森林、草原、公路、湖、山、停车场、港口、铁路、住宅、河),每个类别包含 800 张高质量图像,分辨率为 256×256 像素。该数据集用于空中景观分类,图像共 8k 张,包含 10...

无人机航拍技术迅速发展,突破传统摄影限制,提供高效的数据采集。构建高质量航拍数据集需合理规划,以满足城市规划等需求。HyperAI整理了多个实用数据集,推动航拍领域的研究与应用。

原文中文,约3300字,阅读约需8分钟。发表于:
阅读原文

大规模数据集上文本识别变换器的masked自监督预训练

本研究针对文本识别变换器的预训练阶段提出了两种改进措施,从而解决了现有自监督学习方法对无标签数据的利用不足的问题。通过逐步增加掩蔽概率并修改损失函数,本研究的实验结果表明,该预训练方法在降低字符错误率方面有效,且在某些情况下,相较于迁移学习提升达30%。

发表于:
阅读原文

AnnoPage数据集:具有细粒度分类的文档非文本元素数据集

该研究针对文档布局分析和对象检测的研究缺乏高质量标注数据的问题,提出了AnnoPage数据集,包含7550页历史文档的非文本元素,并将其细分为25类。通过专家图书馆员的精确标注,该数据集为未来研究提供了基准结果,并且公开可用,具有重要的参考价值。

发表于:
阅读原文

使用PHP生成器高效处理大数据集、大文件和数据流

Handling large files (for example, CSV/text files) or HTTP data streams in PHP can be challenging, especially when using traditional methods that load all data into memory. In this article, we’ll...

在PHP中处理大文件(如CSV)时,使用生成器可以逐行处理数据,显著降低内存使用,避免内存溢出。生成器通过yield关键字返回值,适合大数据集和实时数据流,提升性能和可扩展性。相比之下,传统方法需加载整个文件,效率较低。

使用PHP生成器高效处理大数据集、大文件和数据流
原文英文,约900词,阅读约需4分钟。发表于:
阅读原文

如何用Python YOLOv5以最短的方式训练视频数据集?

YOLO stands for “You Look Only Once” and is an extremely fast object detection framework that uses a single convolutional neural network. YOLO is generally faster than other object detection...

YOLO(You Only Look Once)是一种快速的目标检测框架,利用单一卷积神经网络通过将图像划分为网格来快速分类和定位对象,从而显著提高检测速度。YOLO是一个开源的Python计算机视觉库,简化了使用过程。

如何用Python YOLOv5以最短的方式训练视频数据集?
原文英文,约300词,阅读约需2分钟。发表于:
阅读原文