本研究提出了GRIN(梯度信息混合专家训练)来解决混合专家模型在稀疏计算中的训练挑战。GRIN在语言建模任务中的性能超过了同数据集下的7B稠密模型,具有极大的应用潜力。
本文综述了多种时间序列缺失值填充方法,包括BRITS、GRIN和STING等。研究表明,不同方法在填补精度和任务能力上存在差异,且填补效果受数据类型和缺失情况影响。MTSCI模型和端到端神经网络模型在处理缺失数据时表现优越,具有实际应用价值。
本文介绍了一种新型深度估计训练方法,结合多源数据和多目标学习,提出的DDVM模型在深度误差上表现优异,ZeroDepth框架在多种场景下实现最佳效果。此外,基于稳定扩散的Marigold方法和DMD模型显著提升了深度估计的鲁棒性和效率,推动了零-shot单目深度估计的发展。
完成下面两步后,将自动完成登录并继续当前操作。