林俊旸强调,未来的智能体应具备自主学习和环境交互能力,以推动AI在复杂任务中的应用。他指出,解决长尾问题是AI的关键,未来中国在AI领域有望迎头赶上。
本研究分析了大规模视觉语言模型中的长尾问题,发现训练数据在头部概念上过度代表,而尾部概念被低估。提出自适应数据精炼框架(ADR),通过数据重平衡和合成,显著改善了长尾问题,提升了LLaVA 1.5的平均性能4.36%。
本研究提出了一种新的半监督学习方法,解决医学图像分割中的长尾问题。通过结合拉格朗日对偶一致性损失和边界感知对比损失,以及引入CMAformer网络,融合多尺度特征,取得了最先进的结果。
本研究介绍了一种自我训练框架(ST-SGG),通过利用未标注的三元组来缓解场景图生成模型在长尾问题上的困扰。同时提出了一种新型伪标记技术(CATM)和图结构学习器(GSL),对现有场景图生成模型具有益处。实验证明ST-SGG在各种场景图生成模型中有效,特别是在细粒度谓词类的性能提升方面。
本文提出了一种基于多任务学习的动态场景图生成模型,结合局部和全局交互信息,全面理解图像的视觉环境。使用长时人体动作监督模型生成符合约束条件且避免学习尾谓词的场景图。实验证明该框架改善了动态场景图生成,缓解了长尾问题。
完成下面两步后,将自动完成登录并继续当前操作。