该研究提出了一种名为VersionSeek的隐蔽软件版本识别方法,基于功能性变更分析软件更新的功能差异,设计探测请求以提高识别准确率。实验结果表明,该方法在识别率和数据包发送量上均优于传统技术,成功识别了240,020个软件实例,揭示了用户面临的安全威胁。
本文提出了一种针对E2E自动语音识别模型在新电影标题识别中不足的音素纠正方法。该方法通过音素搜索生成替代选项,并结合ASR模型的识别结果,显著提高了识别准确率,错误率降低了4.4%至7.6%。
本研究探讨了文本数据中的说话者识别问题,提出了一种基于大型预训练模型的模糊指纹方法。通过整合说话者特定令牌和上下文建模,显著提高了识别准确率,并在多个数据集上表现优越,为文本基础的说话者识别提供了重要见解。
本研究提出了一种名为MaxGlaViT的轻量级视觉转换器模型,用于青光眼的早期诊断。该模型通过优化网络架构和引入注意机制,实现了92.03%的识别准确率,显示出在青光眼早期检测中的巨大潜力。
研究显示,常用ChatGPT的人能更有效识别AI生成文本,准确率达76%。人类专家在识别上优于自动化工具,因其对语言模式和内容一致性有更强的直觉。
本研究提出了一种隐私保护人脸识别(PPFR)方法,解决了黑箱模型推广和对抗学习的影响。通过扰动全局特征和增强局部特征,识别准确率达到94.21%,在隐私保护和抗重构能力上优于现有方法。
本研究提出了均衡损失(EQL v2)、选择性物体对比学习(SoCo)和针对性监督对比学习(TSC)等新方法,以解决长尾目标检测中的不平衡问题。实验结果表明,这些方法在多个数据集上显著提升了模型的识别准确率和泛化能力,尤其在稀有类别上表现突出。
本研究提出了两种新方法,从桌面录音中提取用户行为,分别为直接帧基和差分帧基。结果表明,直接帧基方法的识别准确率达到70%至80%,并可通过机器人流程自动化重放,显示出良好的应用潜力。
Prompt Engineering是为AI对话设计提示词,以确保AI准确理解用户需求。该过程包括明确目标、设计提示词、优化测试和处理意外情况。随着AI技术的发展,Prompt Engineering逐渐成熟,广泛应用于各领域,如京东物流通过不同提示词提高商品件型判断的准确率。
本研究提出了一种新方法QCS,利用交叉相似性注意力机制和四分支循环框架,解决面部表情识别中的类间相似性和类内变异性问题。该方法有效提取同类特征,去除冗余特征,显著提高识别准确率,并在多个数据集上超越现有技术。
本文探讨了通过模仿灵长类动物的视觉系统和引入物理学概念,提升人工神经网络对抗攻击的鲁棒性。研究表明,改进网络结构和激活层可以提高识别准确率,增强对敌对扰动的抵抗能力,使人工智能更接近人类的视觉识别模式。
本研究探讨了视频生成过程中的先验知识是否适用于视频识别,并提出了GenRec,这是一种将生成与识别联合优化的统一框架。GenRec通过随机帧条件过程实现了显著的表现,在信息有限的情况下,其识别准确率达到75.8%和87.2%,展示了其在视频生成和识别任务中的潜在影响力。
本文介绍了多个手语数据集及其相关研究,包括美国手语、土耳其手语和孟加拉手语。研究者们开发了基于深度学习的手语识别模型,提高了识别准确率,并提供了新的数据集以促进手语技术的发展。这些研究为手语识别领域提供了重要的基准和方法。
本文介绍了多种手势识别方法,包括基于深度神经网络的动态采样、时间归一化和3D卷积神经网络等技术,提出了新的手势数据集和模型,显著提高了识别准确率,解决了个体差异和硬件变化问题,推动了手势识别技术的发展。
华中科技大学研究团队与其他机构合作,开发了一种甲骨文破译优化模型(OBSD),用于解决甲骨文识别问题。该模型利用甲骨文的不可见类别生成现代汉字图像,具有较高的准确性。该研究为古文字识别任务提供了新颖的方法,取得了最高的识别准确率。
本文探讨了阿拉伯光学字符识别(OCR)技术的研究进展,介绍了多种深度学习模型,如BEIT和基于卷积神经网络的儿童手写字符识别模型,均显示出高识别准确率。研究分析了阿拉伯OCR的应用、方法及挑战,强调了预训练语言模型在自然语言处理中的重要性,并比较了不同架构在手写文本识别中的性能。
支付宝医疗大模型亮相,识别准确率达90%以上,具备多模态、安全性、专业性能力。支付宝推出医疗可信一体机+可信云解决方案,落地三大应用领域:医疗、金融、生活。支付宝智能助理首次亮相,可完成办事、问诊、打车等服务。智能认知决策技术与平台获得卓越人工智能奖。
本文提出了多种基于场景图信息的人-物交互检测方法,包括利用几何特征的图卷积网络、时空变换器和级联架构等。这些方法显著提高了识别准确率,并在多个数据集上验证了其有效性,推动了人-物交互识别的研究进展。
本文介绍了多种用于人类动作识别的网络模型,如Modality Compensation Network(MCN)、Modality Mixer (M-Mixer)和CMC-CMKM。这些模型通过深度学习和多模态信息融合,显著提高了识别准确率,尤其在不同数据集上表现优异,推动了动作识别技术的进步。
本文探讨了服务器端重评分技术在虚拟助手中的应用,特别是针对实体丰富的查询。研究表明,结合服务器端语言模型与设备端信号可以提高识别准确率23%-35%。模型融合技术有效整合了不同模型的优势,提升了语音识别系统的性能。
完成下面两步后,将自动完成登录并继续当前操作。