从混合到专业领域的语言模型优化分割
Apple Machine Learning Research
·
使用张量并行在多个GPU上训练大型模型
MachineLearningMastery.com
·
计算最优的量化感知训练
Apple Machine Learning Research
·
苹果也在蒸馏大模型,给出了蒸馏Scaling Laws
机器之心
·