让炼丹更科学一些(二):将结论推广到无界域
科学空间|Scientific Spaces
·
简单的SGD方法在使用一半内存的情况下匹配Adam的性能
DEV Community
·
批量、小批量与随机梯度下降
DEV Community
·