本研究提出了SpecReason方案,旨在解决推理时间中的高延迟问题。该方法通过轻量模型推测中间步骤,减少对重模型的依赖,实现了1.5-2.5倍的速度提升和1.0-9.9%的准确性提高。
本研究提出了一种复合投影剪枝方法,以解决大语言模型在硬件部署中的高计算和内存需求。实验结果表明,该方法使马赛克系统速度提升7.19倍,困惑度降低84.2%,准确性提高31.4%。
该研究介绍了AdCorDA技术,通过修改训练集和利用输入空间训练的对偶性来改进预训练分类器网络。在CIFAR-100数据集上,准确性提高了超过5%。该技术还可增强权重量化神经网络的性能和对对抗性攻击的鲁棒性。
该文提出了一种以期望组件和实现组件为主要模块的隐喻检测架构,通过ER模式训练学习,对三个隐喻数据集进行评估,结果显示该方法具有与现有技术相当或更好的效果,并且通过ER模型的集成可以提高隐喻检测的准确性。
本文研究了将大型语言模型与说明相结合是否能提高上下文学习效果,发现使用不同样式的说明对四个LLM的性能仅会带来小至中等的准确性提高,但text-davinci-002能带来更实质性的提高。文章通过训练校准器使用自动提取的评分评估说明的可靠性,从而在全部数据集上实现后处理性能的提高。
完成下面两步后,将自动完成登录并继续当前操作。