Kallaama项目旨在为农业领域的语音技术发展提供全国语言语料库。他们发布了一个包含沃洛夫语、普拉语和赛尔语的125小时录音的转录语音数据集,专为自动语音识别目的而设计。
该研究提出了DODA,一种能够在农业领域生成高质量物体检测数据的数据合成器。通过将布局编码为图像,提高了布局到图像的可控性,改善了标签质量。使用视觉编码器为扩散模型提供视觉线索,使模型能够在新领域生成数据。在全球小麦头部检测数据集上,DODA合成的数据提高了目标检测器在不同领域中的表现,AP50提升了12.74-17.76。
完成下面两步后,将自动完成登录并继续当前操作。