该研究提出了一种新型深度学习架构XDementNET,旨在提高阿尔茨海默症MRI数据的分类准确性。该模型结合多残差块和空间注意力块,在多分类任务中实现了超过99%的准确率,并具备良好的患者进展可解释性,优于现有方法。
本研究提出了一种新算法CART-ELC,通过在限制的超平面集合上进行穷举搜索,诱导斜决策树。CART-ELC在小型数据集上表现出色,显著提升了分类准确性,生成的决策树更简洁易懂。
本研究分析了视觉变压器在标签噪声条件下的表现,结果显示大模型在分类准确性和校准效果上优于小模型,为资源受限环境的应用提供了指导。
本研究探讨了多模态医学成像中最佳融合时机的确定,提出了一种逐步前向搜索算法,评估不同网络层的融合模块。结果表明,该方法在多模态MRI数据集上提高了分类准确性,降低了计算开销。
本研究提出了两种新算法,解决持续学习中的标签和实例噪声问题。通过构建噪声容忍的重放缓冲区,实验证明这些方法在噪声环境下显著提高了分类准确性,并有效减少了遗忘现象。
本研究探讨了连续变量量子计算(CVQC)与经典机器学习的结合,发现CVQC显著提高了特征表达能力和分类准确性,尤其在高维数据集上,但也增加了计算成本。
本研究提出了一种新模型LSGMER,解决了多模态情感识别中情感标签信息被忽视的问题,显著提高了分类的准确性和稳定性。实验结果表明,该模型在IEMOCAP和MELD数据集上表现优异。
本文提出了一种改进的去噪遮蔽自编码器DenoMAE2.0,结合局部补丁分类与传统重构损失,提升了表示学习和鲁棒性。实验结果表明,其在去噪质量和分类准确性上优于Deno-MAE及其他基线方法。
该研究结合扩散模型与跨类别标签学习,解决医学影像数据稀缺问题,通过合成高质量息肉图像,提高结直肠息肉分类的准确性,并使用真实医学数据集进行验证。
本研究探讨了印度法律判决的语义分割问题,提出了包含7000多个文档和140万个句子的LegalSeg数据集,并标注了7种修辞角色。研究结果表明,考虑更广泛上下文的模型在分类准确性上优于仅依赖句子特征的模型,显示出提高法律文档理解的潜力。
本文比较了DeepSeek与其他大型语言模型在短文本预测中的表现,结果显示DeepSeek在分类准确性上优于大多数模型,但不及Claude,并提供了新数据集以促进未来研究。
本研究提出sDREAMER模型,解决了自动睡眠分期中模态间信息交互不足的问题,显著提升了多通道和单通道输入的分类准确性,为睡眠研究提供了新工具。
本研究提出LegoGCD学习方法,解决广义类别发现中的灾难性遗忘问题。该方法通过调整已知类别样本分布和引入KL散度约束,增强新类别识别,同时保持已知类别的性能。实验结果表明,LegoGCD有效减少了已知类别的遗忘,提高了分类准确性。
本研究提出了一种新的视觉到概念(V2C)标记器,旨在解决传统概念瓶颈模型在视觉识别中对专家知识的依赖。通过该标记器,可以直接从多模态模型构建概念瓶颈模型,从而显著提高分类准确性和可解释性。研究结果表明,V2C-CBM在多个视觉分类基准测试中表现优异。
本研究分析了动态少样本文本分类中神经网络模型的局限性,提出了GORAG框架,通过自适应信息图提取相关信息,显著提升了分类的准确性和全面性,具有重要的应用潜力。
本研究提出Cella框架,结合大型语言模型与图神经网络,解决了节点分类对高质量标注数据的依赖,实现无标签分类,显著提升分类准确性。
自OpenAI发布O1模型以来,AI社区关注推理阶段计算资源的扩展。增加计算能力可提升模型的推理复杂性和答案质量。阿里巴巴的QwQ-32B-Preview模型也遵循这一趋势。研究表明,给予模型更多思考时间能提高分类准确性,尤其在复杂任务中。
本研究提出了Table2Image框架,将表格数据转换为图像表示,以提高分类的准确性和可解释性,提供可扩展且可靠的解决方案。
本文提出了多种改进的多实例学习(MIL)方法,以提高组织病理学全幅切片图像(WSI)的分析性能。包括Hierarchical Attention-Guided框架、改良位置嵌入和自解释MIL方法等,均在多个数据集上表现优异。此外,PathM3框架和PAMT模型通过有效结合图像和文本,提升了分类准确性和生成能力,展示了在临床应用中的潜力。
本研究提出AstroM$^3$自监督预训练方法,旨在解决传统天文学模型对单一数据源的依赖问题,提升分类准确性,并展示在多种下游任务中的应用潜力。
完成下面两步后,将自动完成登录并继续当前操作。