10k 星开源数据处理工具一键启动!支持 176 种语言识别;首个高层坠物检测数据集上线,含 18 个场景的近 2k 个视频
原文中文,约3700字,阅读约需9分钟。发表于: 。该数据集是华中科技大学白翔教授研究团队的王鹏杰等人,提出的高质量 HUST-OBC 数据集,从 3 种不同的来源收集,包括书籍、网站和现有数据集。数据集包含两种类型的甲骨文样本图像,其一是从原始甲骨文拓片的处理扫描中获取甲骨文图像,其二是基于原始甲骨的手写甲骨文图像,进一步细分为基于拓片描摹的图像和基于字形的手写图像。Ref-AVS...
上海人工智能实验室和OpenDataLab团队推出了开源智能数据提取工具MinerU,可以将多模态PDF文档转化为易于分析的Markdown格式,并从网页和电子书中提取内容。hyper.ai官网上线了MinerU一站式数据提取工具Demo。hyper.ai官网还更新了优质教程、公共数据集、社区文章和热门百科词条。