token危机解决?扩散模型数据潜力3倍于自回归,重训480次性能仍攀升

机器之心 机器之心 ·

阅读原文