本研究提出了SpecReason方案,旨在解决推理时间中的高延迟问题。该方法通过轻量模型推测中间步骤,减少对重模型的依赖,实现了1.5-2.5倍的速度提升和1.0-9.9%的准确性提高。
本研究提出了一种复合投影剪枝方法,以解决大语言模型在硬件部署中的高计算和内存需求。实验结果表明,该方法使马赛克系统速度提升7.19倍,困惑度降低84.2%,准确性提高31.4%。
本文介绍了一种名为FLAME的新方法,利用大型语言模型进行分类体系扩展。FLAME通过少量样本中的提示提取语言模型内在知识,并通过强化学习进行微调,以实现更准确的预测。实验结果显示,FLAME在真实场景中取得了显著改善,准确性提高了18.5%,Wu & Palmer指标提高了12.3%。通过案例研究、误差分析和消融研究,阐明了FLAME的优点和缺点。
本研究利用美国航空公司数据,提出了一种新的多模态深度学习方法,用于准确预测航班客流量。该方法结合了循环神经网络和卷积神经网络,利用时间和空间关系提高预测性能,准确性提高了33%。深度学习和细致数据处理在航班客流量预测中具有重要潜力。
该研究介绍了AdCorDA技术,通过修改训练集和利用输入空间训练的对偶性来改进预训练分类器网络。在CIFAR-100数据集上,准确性提高了超过5%。该技术还可增强权重量化神经网络的性能和对对抗性攻击的鲁棒性。
该文提出了一种以期望组件和实现组件为主要模块的隐喻检测架构,通过ER模式训练学习,对三个隐喻数据集进行评估,结果显示该方法具有与现有技术相当或更好的效果,并且通过ER模型的集成可以提高隐喻检测的准确性。
本文研究了将大型语言模型与说明相结合是否能提高上下文学习效果,发现使用不同样式的说明对四个LLM的性能仅会带来小至中等的准确性提高,但text-davinci-002能带来更实质性的提高。文章通过训练校准器使用自动提取的评分评估说明的可靠性,从而在全部数据集上实现后处理性能的提高。
完成下面两步后,将自动完成登录并继续当前操作。