本研究探讨了计算社会科学中的噪声问题,分析了OCR错误、古老语言和主观任务注释不一致等多种噪声形式。研究指出某些噪声可能蕴含有价值的信息,并强调处理噪声时的细微差别及研究者所需的策略。
本研究提出了一种大型语言模型增强的困难样本去噪框架(LLMHD),用于解决传统推荐系统中的噪声问题。通过构建基于LLM的评分器来评估用户偏好与项目之间的语义一致性,优化样本识别过程,实验结果表明该方法在去噪推荐中的有效性显著提升。
本文提出了一种半监督主动学习框架,用于单目3D物体检测,通过激光雷达指导数据选择和训练,解决未标记数据中的噪声问题,实验证明该方法在成本节省和检测精度方面优于现有基线。
PhoGAD是一个基于图的异常检测框架,通过优化行为边界和解决噪声问题,成功检测异常行为。实验证明其性能超越现有框架,并在减少异常比例时仍表现出鲁棒性。持续同调分析显示其在捕获正常边缘特征方面有效。
我们提出了一种名为BalanceMix的数据增强方法,用于解决多标签分类中的类别不平衡和噪声问题。该方法包括两个样本策略,用于生成多样性较高的少数类增强样本,并对多标签进行细分,将噪声标签归类为清晰、重新标记或不确定。实验结果表明,BalanceMix优于现有方法。
本研究提出了一种创新方法ViCGCN,利用上下文化语言模型和图卷积网络解决越南社交媒体中的数据不平衡和噪声问题,并通过实验证明了其优越性。
完成下面两步后,将自动完成登录并继续当前操作。