本研究针对现有缺血性中风病灶分割技术在准确性上的不足,提出了一种基于深度学习的新方法,采用多通道MRI模态进行分割。研究发现,该方法通过结合DenseNet121和自组织神经网络,及创新的损失函数显著提升了病灶分割的准确率,能够有效改善缺血性中风的诊断和治疗规划,为临床决策提供重要支持。
本研究提出了一种基于半球视场LiDAR传感器的3D扫描方法,旨在解决机器人感知与交互问题。通过使用MaskDINO模型,成功检测和分割人体,识别行走、挥手和坐下等动作,展现出良好的性能和应用价值。
研究显示,Wave-U-Net 结构在语音增强中表现优异,特别是在时域建模方面。在 VCTK 数据集测试中,该方法提升了多个指标。简化的隐藏层结构更适合语音增强,并为语音识别预处理提供了新方向。
本研究提出了一种新的双流多通道融合网络,解决了现有图像操作链检测方法的泛化问题和忽视彩色图像通道相关性的问题。实验结果表明其在泛化能力和对JPEG压缩的鲁棒性方面达到了最先进水平。
本研究提出了一种名为ART的伪影去除变压器,用于解决脑电图中的伪影问题。ART通过捕捉EEG信号的瞬时动态,提供了一种全面的去噪方案。经过评估,ART在多种BCI应用数据集上表现优于其他深度学习方法,提升了伪影去除的准确性与可靠性。
我们引入了一种新的跨模态融合技术,用于在自动语音识别中进行生成性错误校正。通过利用声学信息和外部语言表示,我们的方法提高了ASR性能。在多样的ASR数据集上评估,相对于n-best假设的错误率性能提高了37.66%。我们将代码和预训练模型开源。
MuChaPro框架解决了多通道SAR图像中斑点波动的去除问题,通过生成和恢复多个单通道投影,并将其重新组合为多通道估计,支持极化分类和干涉高度估计等应用。该框架还支持特定传感器的自我监督训练策略。
本研究通过卷积神经网络和集成迁移学习的创新方法,提高了孟加拉手写字符识别的准确率。模型在原始数据集上达到92%的准确率,在预处理数据集上达到98%的准确率。
本文介绍了一种多通道说话人归属自动语音识别系统,使用了基于Conformer的编码器和基于说话人归属的Transformer解码器,实验结果显示该系统在词错误率上有显著降低。研究还探讨了不同输入特征对ASR性能的影响,并在AMI语料库上进行了实验验证。
为了解决多模式和多通道记录的生物信号以及其对污染的高敏感性这一困难问题,本文提出了一种识别系统,其中包括两个协同工作的多分类器系统,其中一个用于识别污染通道,另一个用于识别患者意愿导致的运动类别,通过动态选择机制,该系统实现了改进的分类质量。
该研究提出了一种多通道掩码自编码器(MCMA)方法,用于重建 12 导联心电图,减少其临床重要性差距。引入了名为 ECGGenEval 的全面评估基准,包括信号级、特征级和诊断级评估,实现了 12 导联心电图信号和生成模型的全面评估,取得了最先进的性能。
本文介绍了一种基于可见光和热红外图像融合的目标跟踪方法,通过即时学习将两种模态信息融合,提出了一个轻量级的学习器,实验证明其有效性和高效性。
通过深度学习构建融合多通道数据的网络(MCDFN),提高需求预测准确性并实现可解释性,优于其他七个深度学习模型,适用于供应链管理系统且为未来研究提供方向。
提出了一个多通道时空变换模型用于交通流量预测,通过融合来自不同通道的交通数据结果,改善了预测准确性。该模型使用图卷积网络从每个通道提取空间特征,并使用基于变换器的体系结构捕捉通道之间的时间依赖性。在六个真实数据集上的实验证明,引入多通道机制到时间模型中提高了性能,并且在准确性方面优于现有模型。
ICASSP 2024车载多通道自动语音识别(ICMC-ASR)挑战收集了100多小时的多通道语音数据,并设立了ASR和ASDR两个赛道。USTCiflytek团队在ASR赛道上取得了13.16%的CER,在ASDR赛道上取得了21.48%的cpCER,相比挑战基线,ASR方面改进了13.08%,ASDR方面改进了51.4%。
我们提出了一种统一的多通道远场语音识别系统,结合了神经波束成形和基于 Transformer 的 Listen,Spell,Attend(LAS)语音识别系统,进一步扩展了端到端语音识别系统以包含语音增强,并通过共同训练来优化最终目标。
本文研究了基于注意力的空间滤波技术,包括线性和非线性方法,以提高多通道语音增强算法在实际场景中的性能。实验结果表明,这些方法在静态和动态声音环境中均表现出鲁棒性,并优于传统的空间滤波方法。
通过跨媒体聚焦损失函数分析频率和可见光谱信息,我们提出了一种用于检测完全合成面部图像的多通道架构,并与使用二进制交叉熵训练的相关架构进行比较。跨模型实验表明,受跨媒体聚焦损失函数监督的所提出的架构通常具有最具竞争力的性能。
该文提出了MCDC结构,利用多通道连续数据的内在特征和1DCNN-attention机制评估变压器状态。实验证明MCDC具有更好的泛化能力和稳定性。
完成下面两步后,将自动完成登录并继续当前操作。