本研究探讨了小规模语言模型在课程学习中的效率,提出了更细致的学习策略,并构建了四个儿童导向的语料库。结果表明,灵活的学习策略显著提升了模型的性能。
本研究提出了一种可微分数据奖励(DDR)方法,解决了检索增强生成(RAG)方法中忽视数据偏好的问题。DDR能更好地对齐RAG系统中各模块的数据偏好,尤其在小规模语言模型中效果显著优于传统方法。
本研究比较了Dropout和随机Delta规则(SDR)算法在神经网络参数估计中的表现,结果显示SDR优于Dropout。提出的上下文辍学模块和R-Drop方法在多个深度学习任务中表现出色,有效防止过拟合。此外,AD-DROP策略通过注意力机制提升模型预测能力。研究还探讨了小规模语言模型的预训练效果及模型崩溃问题,提出混合真实与合成数据的训练方法以避免崩溃。
完成下面两步后,将自动完成登录并继续当前操作。