本研究提出了一种联邦黑寡妇优化(FedBWO)技术,以解决资源受限设备的传输能力不足问题。该方法仅传输性能得分,从而减少通信数据量,实验结果显示准确率提高了21%,通信成本显著降低。
本研究提出了一种自适应奇异值分解方法AdaSVD,旨在解决大型语言模型在资源受限设备上的高内存需求。该方法通过动态调整压缩比例和更新奇异矩阵,显著提升了内存效率和性能。
该研究提出了DiffRatio-MoD框架,解决了扩散变换器在资源受限设备上的高延迟和内存低效问题。通过动态计算路由,令牌计算需求可适应性调整,显著提升了生成质量与效率的平衡。实验结果表明,该方法在文本到图像生成和图像修复任务中优于现有技术。
本研究提出了一种自适应剪枝方法(SAAP),旨在解决大型语言模型在资源受限设备上的部署问题。SAAP通过自适应重要性指标和模块排名,降低计算和内存成本,同时保持模型性能。实验结果表明,SAAP在准确性和生成速度上显著优于现有方法,具有实际应用价值。
本研究提出了SoftmAP方法,旨在解决大语言模型在资源受限设备上的计算和内存开销问题。该方法通过利用内存计算硬件实现低精度Softmax,仅使用整数,从而显著提高能量延迟产品,提升模型的可部署性而不损失性能。
ONNX MLIR 是一种基于 MLIR 的工具,旨在优化 ONNX 模型在资源受限设备上的运行效率。通过静态编译,ONNX MLIR 能够减少运行时开销,并针对特定硬件进行深度优化,如降低浮点精度以提升计算效率,使深度学习模型在嵌入式系统中更高效。
本研究提出了一种新颖的层微调方案,旨在提高资源受限设备上联邦学习中大型语言模型的效率。该方案在计算和内存约束下优于现有方法,并在有限通信条件下的准确度与LoRA相当,显著提升了训练准确性。
随着个性化和隐私需求的增加,源无关无监督领域适应(SFDA)在时间序列数据中变得重要。我们提出了一种新方法,通过Tucker分解优化源模型权重,并在目标侧微调部分因子,提高效率和适应性。实验显示,该方法在资源受限设备上的时间序列应用中表现优异。
本文介绍了一种基于信息矫正模块和分布引导蒸馏的量化视觉变换器压缩方法,在ImageNet上实现了80.9%的准确率。研究提出了多种量化框架和技术,如ADFQ-ViT和PSAQ-ViT,显著提升了视觉变换器的性能,适用于资源受限设备。实验结果表明,这些方法在不同任务中表现优异,降低了推理复杂度和搜索成本。
该研究提出多种联邦学习方法,旨在提高资源受限设备的参与率和模型准确性。通过联邦子模型学习、语义相似性聚合和异构个性化学习等技术,优化模型共享和通信效率,显著降低成本并提升性能,验证了其在实际应用中的可行性。
本文探讨了多种知识蒸馏技术在自动语音识别中的应用,包括逐层蒸馏、Tiny语音增强模型的压缩方法和自适应知识蒸馏技术。这些方法显著提高了识别准确性和性能,降低了错误率,尤其在资源受限的设备上表现优异。
本文介绍了一种基于信息矫正模块和分布引导蒸馏的量化视觉变换器压缩方法,在ImageNet上实现了80.9%的准确率。研究探讨了ViTs的量化技术、硬件加速及其在资源受限设备上的应用,提出多种量化方法以提升模型性能和训练效率,旨在推动无人机监视和环境监测等领域的应用。
本文提出了一种名为RE-FL的新方法,旨在解决资源受限设备中的计算和通信挑战。通过可变修剪技术和知识蒸馏,优化资源利用,减少带宽消耗。实验表明,该方法在保持数据隐私和性能的同时,显著提高了全球模型的准确性,增强了联邦学习的韧性和可扩展性。
本文探讨了在资源受限设备上实现基于Conformer的语音识别系统的挑战与解决方案。研究提出了一系列模型架构调整和优化方法,使得在小型可穿戴设备上实现高效、低能耗的实时语音识别,且不降低准确性。该系统的识别速度超过实时5.26倍,具有广泛的应用潜力。
本文介绍了多种大型语言模型(LLMs)的修剪方法,如GBLM-Pruner、Wanda和LLM-Pruner。这些方法通过结构修剪和自动化度量标准,提高了模型性能和压缩效果,减少了重新训练的需求。实验结果表明,这些方法在语言基准测试中表现优异,适用于资源受限设备。
本研究提出了一种方法,将大型语言模型(LLMs)的知识提炼为更小、更高效且准确的神经网络,以在资源受限设备上部署模型。通过测试,发现提炼的学生模型准确率优于原始神经网络模型。此研究对自动评分在教育环境中的应用具有潜力。
研究人员提出了一种创新的方法,将早期退出和分裂计算合并在一起,以解决深度神经网络在资源受限设备上的部署问题。实验证明,这种方法能够显著降低成本。
该研究提出了一种面向资源受限设备的分散协作机器学习框架,通过增量学习算法、模型交换协议和预测算法实现了准确性、训练时间和鲁棒性的显著提升。
完成下面两步后,将自动完成登录并继续当前操作。