本文介绍了一种名为SpectralCentroidTransformer(SCT)的语言模型架构,灵感源自神经科学。该模型通过频率分解和语义聚类,将语言建模分为两个阶段,以提高可解释性和鲁棒性。实验结果显示,SCT在标准NLP基准测试中表现优异,更好地捕捉语言内在结构。
本文针对FP4精度训练过程中显著的准确性下降问题,提出了一种新颖的TetraJet训练方法。通过评估训练中涉及的量化器,本研究识别出权重振荡是造成MXFP4训练性能降级的主要原因,并引入了EMA量化器和自适应坡度优化器来解决这一问题。实验结果表明,TetraJet在视觉变换器任务中优于现有的4位训练方法,准确性降低幅度减少超过50%。
本文介绍了一种基于深度学习的扫描超透镜显微镜(SSUM)系统,该系统通过将光学超分辨率图像与扫描电子显微镜图像相结合,实现了高细节图像的生成,适用于芯片缺陷检测和生物样品分析。同时,研究探讨了光衍射神经网络(D2NN)在图像分类中的应用,显著提高了准确率,为光学成像和传感系统的发展提供了新思路。
本文探讨了脉冲神经网络(SNN)在语音识别中的应用,展示了其在性能和抗梯度爆炸方面的优势。研究表明,代理梯度方法能够有效训练SNN,优化其动态行为,并为基于脉冲信号的神经计算提供新的监督学习算法。此外,提出的Spiketrum模型实现了高效的脉冲编码,推动了听觉感知任务的发展。
该研究提出了一种针对稳定扩散模型的会员推理攻击方法,揭示了隐私漏洞。通过黑盒查询,攻击成功率达到60%。研究强调了加强防御措施的必要性,并探讨了信号泄漏对生成图像的影响,提出了提高图像生成控制性和质量的新方法。
本研究探讨了大型语言模型(LLMs)的稳健性和可信度,提出了新的评估方法和用户友好的平台。通过引入CIPHER通信机制和个性化加密策略,提升了模型间的交流效率和安全性。同时,研究展示了在边缘设备上实现数据本地性的新框架PrivateLoRA,显著提高了计算效率和性能。
电感器是一种将电能转化为磁能并存储的元件,具有滤波、振荡、延迟、陷波等作用。它由骨架、绕组、屏蔽罩、封装材料、磁心或铁心等组成。电感器分为自感器和互感器,具有通直流、阻交流的特性。常与电容器一起使用,构成LC滤波器、LC振荡器等。
本文探讨了在边缘设备上部署量子化网络的策略,提出了基于指数移动平均的更新方法和纠正振荡误差的校正方法,通过实验证明这些方法能提升低精度YOLO网络在目标检测和分割任务的性能。
完成下面两步后,将自动完成登录并继续当前操作。