本研究提出DnLUT框架,通过查找表和通道混合器实现高效彩色图像去噪。该框架存储需求仅为500KB,能量消耗为0.1%,推理速度提高20倍,有效解决了深度神经网络在边缘设备上的计算和内存问题。
本研究提出了一种新工具STEMS,用于优化脉冲神经网络(SNN)的时空映射。该工具显著减少了数据移动和能量消耗,最高可降低12倍和5倍,同时保持准确性。
本研究提出了BEFL框架,以解决移动边缘物联网中联邦学习的能耗不平衡问题。实验结果表明,BEFL使全球模型准确性提高1.6%,能耗方差降低72.7%,总能量消耗减少28.2%。
本研究提出FAMES系统,有效解决了在仅2位量化的深度神经网络中应用近似乘法器的问题。实验结果显示,该方法在保持1%以下的准确性损失的同时,能量消耗减少28.67%,速度比传统方法快300倍。
该研究探讨了电动车在能量消耗、充电决策和最后一公里配送中的优化方法,提出了基于强化学习和深度学习的模型,显著提高了预测准确性和能效,推动可持续电动出行的发展。
本研究提出了一种基于物理的神经双向反射分布函数(PBNBRDF)模型,解决了材料外观模拟中的物理约束不足问题。通过施加亥姆霍兹对称性和能量消耗约束,显著提升了材料重建的视觉质量和色彩准确性,实验结果表明该方法能更真实地表示数据,改善渲染质量。
本研究提出了一种新型卷积神经网络剪枝算法,显著降低能量消耗并提高准确性。通过保留权重矩阵的前k个元素,提升学习效率。同时,介绍了Sparse CNN加速器,利用零值权重和激活来提高性能和能源效率。研究探讨了深度学习模型在准确性与能耗之间的权衡,强调优化模型效率的重要性。
TinyML 是一种嵌入式机器学习技术,旨在使机器学习应用在资源受限的设备上运行。本文综述了 TinyML 的背景、工具、应用及未来研究方向,特别探讨了其在电动车充电基础设施网络安全中的应用及面临的挑战,如能量消耗和内存限制。案例研究展示了 TinyML 在降低延迟和内存使用方面的优势。
本研究提出了静态和动态模型选择策略,以优化集成学习系统的性能并降低能量消耗。结果表明,静态策略提高了F1得分,同时能量使用降低至62%;动态策略进一步提升了F1得分,能量使用为76%。研究强调了在实际生产环境中,关注能源的模型选择具有重要应用价值。
FinalSpark开发的活体计算机由16个类器官或实验室中培育的脑细胞团组成,能效提高100万倍。这些脑器官是源自人类干细胞的微小自组织三维组织培养物,寿命约为100天。活体机器消耗的能量比目前使用的数字处理器少一百万倍以上。科学家发现,人脑仅消耗10到20瓦的电力,而计算机消耗21兆瓦。
该论文介绍了开源工具eco2AI,旨在帮助科学家追踪深度神经网络的能量消耗和碳排放,推动可持续AI架构的研究。研究提出了碳排放效率指标,评估不同模型的能源使用,发现大而稀疏的模型能有效减少能耗。此外,还介绍了LLMCarbon等工具,以提高大型语言模型碳足迹估算的准确性,促进机器学习的绿色发展。
本文探讨了通过基站的开关操作,利用近似动态规划和机器学习技术降低无线电接入网络的能量消耗。研究表明,基于强化学习的开关方案能显著提高能源效率,同时保持可接受的延迟性能。
本文研究了深度学习模型架构与环境影响的关系,重点分析了能耗和二氧化碳排放。通过测量和预测,揭示了边缘设备中深度学习的能量消耗特征,并强调优化模型效率以推动可持续发展的重要性。研究探讨了准确性与电力消耗的权衡,提出了新的度量标准和工具,以帮助选择高效的深度学习算法,降低碳排放。
该研究提出了一种硬件感知工具ODiMO,用于映射芯片上的不同加速器,以降低推理能量消耗或延迟。在实验中,ODiMO成功降低了能量/延迟,而精度下降有限。
本研究对移动AI应用的不同DNN模型和处理源进行了全面研究,重点关注计算资源利用率、延迟和能量消耗。通过实验测量了所有模型的延迟、能量消耗和内存使用情况,并提出了一种预测能量模型的方法。该研究为AI研究社区提供了关键事实和能量预测机制,以帮助移动AI应用程序实现能源效率。
本文研究了无人机路径设计问题,提出了一种基于强化学习的算法,通过学习MDP的状态-价值函数来求解。使用瓦片编码处理大状态空间,该算法可适用于在线和离线实现,并成功避免了城市环境中蜂窝网络的覆盖漏洞。
该文介绍了一种基于电压相关动态的离子通道基础箱体的储层计算方法,实现了更快的信息处理速度、更低的能量消耗和较小的面积占用。实验证明了这种方法的预测和分类准确率高于传统方法。
该文介绍了一种基于软演员批判深度强化学习(DRL)的联邦学习(FL)解决方案,旨在最小化FL过程的能量消耗。该方案采用编排参与设备的计算和通信资源的方法,同时保证模型性能和最小化总能量消耗。
本文介绍了改进的脉冲变压器(Spikformer)用于处理语言任务,并提出了两阶段知识蒸馏方法来训练它。通过从BERT对无标签文本进行知识蒸馏的预训练和再次从BERT进行微调,训练出的SpikeBERT模型在英文和中文文本分类任务上表现优于最先进的SNNs,甚至与BERT相当,并且能够降低能量消耗。
这篇论文介绍了一种用于深度学习能量消耗的精细测量框架FECoM,通过静态插桩和考虑计算负载和温度稳定性等因素解决了能量消耗测量的挑战。使用FECoM研究了TensorFlow的能量消耗与参数大小和执行时间的关系,希望促进深度学习能量测量和能量感知实践的发展。
完成下面两步后,将自动完成登录并继续当前操作。