本研究提出了文本到歌曲合成的新任务,使用Melodist方法结合歌声和伴奏生成。通过预训练学习解决了数据稀缺问题,评估结果显示Melodist能够合成质量和风格一致的歌曲。
本研究介绍了一种基于弥散模型的自监督预训练协议,用于X射线图像中的地标检测。结果表明该自监督框架在少量可用的已注释训练图像上能够提供准确的地标检测,优于ImageNet有监督预训练和最先进的自监督预训练方法。这是首次探索了弥散模型在自监督学习中应用于地标检测,有望成为缓解数据稀缺问题的宝贵预训练方法。
德国弗劳恩霍夫数字医学研究所的研究人员提出了一种多任务学习策略,通过训练一个通用生物医学预训练模型(UMedPT)来解决生物医学成像中的数据稀缺问题。他们使用多任务数据库训练了UMedPT,并采用了各种标记策略。UMedPT的表现优于ImageNet预训练和之前的模型。该研究为深度学习在医学领域的应用前景开辟了新的可能性。
上海人工智能实验室的研究者创建了一个虚拟小镇,用于模拟互动3D社会,解决具身智能领域的数据稀缺问题。该小镇包含10万个交互式场景和89种场景类别,主要包括GRScenes场景数据集、GRResidents非玩家角色系统和GRBench评估工具。作者希望这项工作能为具身AI研究提供全面评估。
本论文研究了细粒度手绘图像检索模型中的数据稀缺问题,并提出了一种半监督框架,利用未标记的照片提升模型表现。实验证明该模型性能显著提升。
本研究提出了一种机器学习模型,可准确预测薄膜材料的结晶维度和空间群。通过物理驱动数据扩充策略,解决了数据稀缺问题,使模型具有高精度。
本论文研究了细粒度手绘图像检索模型中的数据稀缺问题,并提出了一种半监督框架,利用未标记的照片提升模型表现。实验证明,该模型性能显著提升。
完成下面两步后,将自动完成登录并继续当前操作。