本研究提出了一种MAC-调优方法,旨在解决大语言模型在多问题设置中生成虚假信息的问题。该方法通过分离答案预测与置信度估计,显著提高了模型的平均精度,基准测试中提升了25%。
本研究提出了一种无训练的视频动作定位方法VideoGEM,利用预训练的图像和视频语言模型,通过动态调整层权重,分别处理动作、动词和对象提示,显著提高了动作定位精度,超越了现有最佳方法。
本研究提出了一种名为SpeechPrune的标记修剪策略,旨在解决语音大型语言模型处理长语音输入的局限性。该策略通过语音-文本相似性和注意力分数剔除无关标记,在SPIRAL基准测试中,20%的修剪率下精度提升29%,并在高达80%的修剪水平下保持网络性能。
本研究提出了一种结合均值教师模型与监督对比损失的方法,以提高半导体制造中晶圆图案识别的精度。实验结果表明,该方法在准确率、精确率、召回率和F1分数上均显著提升,具有实际应用潜力。
本文介绍了一种新型目标检测方法,通过点击物体中心标注边界框,结合弱监督技术,显著减少标注时间。研究提出了多种基于中心点和自监督学习的算法,提升了目标计数和检测的精度与效率,尤其在多个数据集上表现优异。
本文介绍了一种名为“Recombinator Networks”的模型,通过信息重组的方式实现对精确定位的支持,精度提升并降低误差30%。作者还提出了基于卷积神经网络的去噪预测模型,进一步提升性能。
本文介绍了一种基于CNN模型的场所识别技术,使用组合得到CNN模型的强大特征,并在基准数据集上进行评估,取得了75%的提升和100%精度,优于之前所有的最新技术。同时,对所有21个层的特征进行了全面的性能比较。
本文研究了神经网络处理时间变化数据流时的灾难性遗忘问题,并提出了一种基于Experience Replay的方法,相比rehearsal方法有更高的精度。
本文研究了使用基于GPT-4的ChatGPT模型进行工程基础考试的可行性和有效性,并通过非侵入式提示修改实现了模型的显著精度提升。研究还探讨了复杂工程问题的解决方案,并强调了AI在教育领域中的挑战,如实现对不同种族和背景学生的包容性和无歧视性。
飞桨AI套件团队最近推出了PP-OCRv4,对PP-OCRv3进行了全方位的改进,提升了中文场景、英文数字场景和多语言场景下的精度。PP-OCRv4已随PaddleOCR 2.7版本正式发布,改进包括检测模块和识别模块的优化,使用了数据挖掘方案和DKD蒸馏策略。PP-OCRv4模型已上线飞桨AI套件PaddleX,提供在线体验和自己创建模型的功能。
完成下面两步后,将自动完成登录并继续当前操作。