本研究提出了一种新方法,通过利用大型语言模型的不确定性和文本特征来估计多项选择题的难度,显著提高了预测准确性,并在公开数据集上取得了领先结果。
本文提出使用多通道音频中的低级空间特征进行声音事件检测。通过扩展卷积递归神经网络以处理更多类型的特征,并将特征呈现为体积的单独层,可以更好地学习多通道音频中的声音事件。该方法在公开数据集上提高了F-score。
本研究提出了BSR-Net,一种用于解决半监督多器官分割中类别不平衡问题的两阶段半监督网络。该方法通过平衡子类生成策略和辅助子类分割任务,显著提升了模型处理类别不平衡的能力,并在公开数据集上验证了其优越性。
该文章介绍了一种通过低成本传感器提供视觉估计的冗余的方法,以实现自主机器人的准确测量机器人的潜在状态和感知环境。该方法包括两个模块,能够高效计算机器人姿势和配置,并通过少数迭代步骤对初始解进行改进。该方法在公开数据集上进行了评估,表现具有竞争力且速度更快。
介绍了一种考虑时间依赖性的模糊感知情绪分布的建模方法,通过额外约束保证预测分布有效。在公开数据集上评估,表现有希望。
本文提出了一种基于对比学习的面部表情识别框架ViewFX,能够准确分类面部表情,无论观察角度如何。实验证明该方法在公开数据集上表现优于以往方法,并对挑战性观察角度和训练样本标签数目具有较低的敏感性。同时,进行了敏感度和消融实验,评估了模型不同部分的影响和对参数的敏感性。
本文介绍了两种基于混合密度网络的分类模型,通过拟合高斯混合模型到数据中,并使用拟合的分布对样本进行分类。这些模型在公开数据集上表现良好,并在真实世界的产品捆绑应用中展示了实际用途。
该文介绍了一种基于多阶段LSTM网络的动作预测方法,能够在视频序列仅有少量片段的情况下实现高准确度的预测。在多个公开数据集上,相对提升了22.0%(JHMDB-21),14.0%(UT-Interaction),和49.9%(UCF-101)的准确率。
RS-MetaNet是一种简单而有效的方法,通过任务级别组织训练,学习遥感场景分类的度量空间。它使用新的平衡损失函数,在三个公开数据集上展示了最先进的结果。
完成下面两步后,将自动完成登录并继续当前操作。