MIT研究人员提出了一种新方法,通过比较目标模型与类似模型的回答,识别自信但错误的响应。他们的总不确定性度量(TU)结合自我一致性和模型间不一致性,能更有效地识别不可靠的预测,尤其在唯一正确答案的任务中表现突出。
本研究提出了音频时序推理评估(TREA)数据集,以解决大型音频语言模型(LALMs)在时序推理任务中的评估不足。研究结果表明,开源LALMs在该数据集上的表现远低于人类,并引入了一种新的不确定性度量,强调全面评估LALMs在高风险应用中的重要性。
本文提出了一种分层点云主动学习策略,通过使用上下文信息的分层最小边距不确定性模块对每个点进行不确定性度量,并设计了特征距离抑制策略来选择重要和代表性的点进行手动标注。实验结果表明,该框架在S3DIS和ScanNetV2数据集上的性能优于最先进的弱监督和主动学习方法,仅使用0.07%和0.1%的训练数据时分别达到了96.5%和100%的性能。
本文提出了一种分层点云主动学习策略,解决了学习3D点云分割的问题。通过使用上下文信息的分层最小边距不确定性模块对每个点进行不确定性度量,并设计了特征距离抑制策略来选择重要和代表性的点进行手动标注。实验结果表明,该框架在使用极少量训练数据时性能优于其他方法。
完成下面两步后,将自动完成登录并继续当前操作。